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LES MODELES STOCHASTIQUES 
EN GÉNÉTIQUE DE POPULATION 


G. MALECOT 


INTRODUCTION 


La notion de ‘'population infiniment nombreuse''(l) traduisait une 
approximation qui est parfaitement justifiée dans certaines circons- 
tances : toutes celles où la composition de chaque génération peut être 
regardée comme parfaitement définie par la composition de la généra- 
tion précédente. La présente étude va porter au contraire sur le cas 
d'une ‘population d'effectif limité'', c'est-à-dire d'une population dans 
laquelle les gamètes qui sont à l'origine de chaque génération LP CE 
sulteront d'un nombre limité de ‘tirages au sort'' parmi les gamètes 
(en nombre illimité) auxquels pourrait théoriquement donner naissance 
(dans la génération précédente F,), l'un ou l'autre des systèmes de 
croisement précédemment définis. Sur les gamètes choisis par ces ti- 
rages, ou ''gamètes utiles" (mâles ou femelles), la fréquence effective 


q' du gène a diffèrera en général -du fait du nombre limité de tirages- 
de la probabilité qu'avait chaque gamète de porter a. 


Cette différence traduit l'''effet de hasard" (randomdrift, genetic 
drift) dans la reproduction. Cet ‘'effet de hasard'' fait de la fréquence 
q' une ‘'variable aléatoire'', mais il nous sera possible de formuler la 
loi de probabilité de cette variable aléatoire sous les hypothèses sui- 
vantes : nous supposerons que les tirages au sort qui fournissent les 
différents gamètes utiles mâles (ou femelles) sont indépendants et ont 
chacunune probabilité q, de fournir le gène a, q, étant une fonction dé- 
terminée de la fréquence effective q du gène a parmi les gamètesutiles 
de la génération précédente, (fréquence qui est la moyenne arithmé- 


+ 
tique D des fréquences des gamètes mâles et femelles). 


(1) dont l'évolution ‘'déterministe" sous les hypothèses usuelles a été résumée 
dans mon mémoire de ‘Population, 1955, n°2, p. 239. 
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Nous allons indiquer des conditions suffisantes sous lesquelles 
ces hypothèses seront vérifiées, conditions qui formeront l'ossature 
des différents modèles étudiés. 


1/ La (faible) sélection et la mutation seront supposées confor- 
mes au modèle D de mon mémoire cité. Ce modèle est regardé comme 
définissant les croisements théoriques, la survie théorique des zygotes 
et la production théorique des gamètes en nombre illimité, parmi 
lesquels sont choisis les gamètes utiles à l'origine de F,,,. Ce modèle 
permettra donc de calculer les probabilités, pour chaque gamète utile, 
de dériver d'un croisement déterminé, puis d'un zygote déterminé issu 
de ce croisement, et enfin d'être porteur du gène a ; les probabilités 
relatives à la production des différents zygotes par chaque croisement 
et à la productiondes différents gamètes par ces zygotes, étant parfai- 
tement définies par les lois de Mendel et par la donnée des constantes 
de sélection, il suffira de connaître, en outre, le système de croise- 
ment et la fréquence q de a parmi les gamètes utiles de la génération 
précédente, pour pouvoir en déduire la probabilité q, comme fonction 
de q et des coefficients de sélection et de croisement) à l'aide de la 
formule : 


(D;) 4,-4,*,6(4) = -uq+v(l> qhhpd' ft Pt PNR Ah 


Nous nous bornerons, sauf indication contraire, au cas où la même 
formule est valable pour les gamètes mâles et les gamètes femelles, 


c'est-à-dire au cas de gènes autosomaux et de coefficient de sélection 
indépendants du sexe, 


2/ Cette probabilité fixe q, sera regardée comme attachée au ti- 


rage qui détermine chaque gamète utile, quels qu'aient pu être les re- 
sultats des tirages ayant préalablement déterminé d'autres gamètes 


utiles ; autrement dit, les tirages des divers gamètes utiles d'une mé- 
me génération seront assimilés à des tirages dans une urne à compo- 
sition constante(l) (où l'on remet les boules tirées). Cette hypothèse 
paraît fort critiquable : dans le cas théorique, où le nombre des gamè- 
tesutiles produit par chaque individu serait invariable -par exemple si 
ce nombre était égal à 2, ce qui assurerait la constance rigoureuse de 
l'effectif de la population au cours des générations- il est clair que le 
tirage préalable d'un certain nombre -2 par exemple- des gamètes uti- 
les, issus d'un même individu, exclurait toute participation de cet indi- 
vidu à la production des autres gamètes utiles (il y aurait analogie avec 
un tirage d'urnes où l'on ne remet pas les boules tirées). Notre hypo- 


(1) I s'agit d'une composition constante pour tous les tirages relatifs à une mé- 
me génération, car nous verrons que la composition change d'une génération 
à la suivante. 


LES MODÈLES STOCHASTIQUES EN GÉNÉTIQUE DE POPULATION 175 


thèse revient donc à admettre que, aussi longtemps qu'il y a des tirages 
de gamètes, tous les individus de même génotype de la génération con- 
sidérée, y participent également, quel que soit le nombre de gamètes 
utiles qu'ils ont déjà fourni ; cela entraîne que le nombre de gamètes 
utiles produit par chacun de cesindividus, sont des variables aléatoires 
indépendantes, obéissant à des lois binomiales très voisines pratique- 
ment de lois de Poisson (dont la moyenne k peut naturellement -dans 
le cas de sélection- dépendre du génotype des individus et du gène porté 
par les gamètes), Nous avons donc introduit une hypothèse -que l'on 
peut appeler hypothèse de "fécondité poissonnienne''- qui rendra plus 
commode nos calculs ultérieurs. Mais nous verrons, dans un autre 
article, qu'il est facile, moyennant l'introduction dans les formules 
d'un facteur correctif, de s'affranchir de cette hypothèse restrictive, 
en englobant l'éventualité où la distribution de gamèties utiles, produits 
par un même individu, a une variance inférieure ou supérieure à celle 
(égale à la moyenne k) d'une loi de Poisson (ce qui correspondrait à un. 
schéma d'urnes "“hyponormal!"' ou ‘'hypernormal"'). 


Dans l'hypothèse de ‘fécondité poissonnienne"', il est facile de 
définir en fonction de q, (donc de q) la loi de probabilité de la fréquence 
q', (ou q) du gène a parmi les gamètes utiles mâles (ou femelles) à 
l'origine de F,,,. Si l'on désigne par N le nombre d'individus comptés 
à la naissance dans F,,,, N est aussi le nombre de gamètes utiles de 
chaque sexe à l'origine de K,,,, le nombre Nq', (ou Nq°) de ces gamè- 
tesutiles mâles (ou femelles) porteurs de a obéira à une ‘loi binomia- 
le'', dont les probabilités sont les différents termes du développement 
de (p,+q.,)". Si l'on regarde N comme une constante, ou bien comme 
une quantité dont la loi de variation au cours des générations est don- 
nue, (ce qui se justifie toutes les fois que la concurrence écologique 
impose à l'effectif un niveau sensiblement déterminé, mais exclut, 
par contre, les cas de ‘'peuplement des places vides" ou de ‘'popula- 
tions trop peu nombréuses'"')}, la connaissance de la fréquence q fixera 
complètement la loi de probabilité de la fréquence q', (ou q') à la gé- 
nération suivante, etenparticulier, elle fixera sa valeur moyenne -qui 
sera q,= q+5(q)-, et sa variance, qui sera p,q./N. Puisque nous nous 
sommes placés dans le cas de gènes autosomaux et de coefficients de 
sélection indépendants du sexe,q, est indépendant du sexe, donc la loi 
de probabilité, la moyenne, et la variance, seront les mêmes pour les 
gamètes mâles et les gamètes femelles (les zygotes mâles et femelles 
qui auront donné respectivement naissance à ces gamètes auront été 
prélevés parmi les descendants d'un même ensemble de croisements 
théoriques, et présenteront par suite les mêmes probabilités). Mais 
l'indépendance qui existe par hypothèse entre tous les gamètes de mé- 
me sexe, ne peut pas être regardée comme subsistant intégralement 
entre les gamètes de sexe différents :eneffet, à tout gamète utile mâle, 
correspond un gamète femelle qui s'unit à lui et qui ne peut être regardé 
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comme choisi indépendamment, car il existe en général entre les 2 
gamètes qui s'unissent, une ‘corrélation gamétique'" que nous avons 
calculée dans 2 cas importants (‘'Population'"', 1955, p.246 et 250)et 
que nous avons désignée par f. On voit aisément que f est aussi le coef- 
ficient de corrélation de q! et q!. Connaissant f, il est possible de cal- 
culer la moyenne et la variance de la fréquence q' du gène a sur l'ensem- 
ble des N individus naissants de F,,, ; car q' est évidemment la demi- 
somme des fréquences de a chez les gamètes utiles mâles et les feme- 


DU Oo+ ! 
les qui se sont unis pour constituer ces individus : q' + + Ace 
donc pour valeur moyenne la valeur moyenne commune de q! et q: qui 
est q, = q+56(q); mais la variance de q' est inférieure à celle (P:q/, ) 


de q' et q, ; elleesten effet égale à ” [variance (q' ) + variance (q! )+2 


covariance (q', q!)]lc'est-à-dire [ER 2f _ JF (PAIN ONE 


Nous sommes ainsi parvenus à calculer la moyenne et la variance 
de la loi de probabilité ‘'conditionnelle"" de q' (fréquence de a dans F,,.,) 
quand q (fréquence de a dans la génération précédente F,) est connu. 


Si la loi conditionnelle était complètement formulée, elle défi- 
nirait un schéma de ‘chaîne de Markoff'' (dont elle représenterait la 
l'probabilité de passage") qui relierait les fréquences q, q', ..., dr}, 
du gène a dans les générations (naissantes) F,, F,,,, ...,F,,, ... 
Ce schéma permettrait (en faisant n = 0) d'exprimer, en fonction de la 
“fréquence initiale" q,, la loi de probabilité "a priori de la fréquence 
dans la Abo génération postérieure. Il résulte de la théorie de 
chaîne de Markoff que cette loi de probabilité à priori tend, dans le cas 
‘non oscillant", vers une loi limite (‘'distribution stationnaire") quand 
le nombre p de générations tend vers l'infini ; cette loi limite existe 
certainement et est indépendante de la fréquence initiale q, dans le "cas 
régulier'', où l'on se trouve toutes les fois que le passage, en un nom- 
bre fixe convenable de générations, de toute valeur de la fréquence à 
une valeur particulière au moins de celle-ci est possible, donc, en 
particulier, quand il y a sélection et mutation(2). On peut montrer que, 
quand il n'y a pas de mutation, il y a encore une loi limite, mais elle 


(1) Cette variance est donc comprise entre P,q/2N (panmixie) et P,d/N (homo- 
gamie totale). (11 y a lieu de corriger la formule erronée de G. Malécot (1), 
p.46). 


(2) Mais non quand il il y a sélection seule, car on peut jamais en l'absence de 
mutations, passer des valeurs q = 0 ou q = 1 à d'autres valeurs au cours des 
générations ultérieures. 
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dépend de la fréquence initiale 4. Nous allons d'abord, dans un pre- 
mier modèle A), chercher la moyenne et la variance des lois limites 
dans le cas où il n'y a pas de sélection. 


À - CAS DE GENES NEUTRES SUJETS A MUTATION (et, 
éventuellement, à immigration en provenance d'un groupe 
à composition constante). 


Puisqu'il n'y a pas hypothèse aucune sélection (génétique ou zy- 
gotique), les ‘constantes de sélection" t,, t,, w, qui figurent dans la 
formule (D;) sont nulles, et (D;) se réduit à la formule linéaire : 


(1) Mar (q) QE ua vit) 


u et v désignant les ‘taux de mutation" de a en À et de À en a (dans 
le cas où la population étudiée subirait en outre une immigration, à un 
taux constant m, en provenance d'une autre population où la fréquence 
de a serait une constante q,, nous avons vu M(op:cit.Jhp#252 et 260]"autil 
suffit de remplacer u et v paru'=u+mpetv'=v+ma,, quantités 
que nous appelons les ‘taux de mutation modifiés'' et dont il est bon de 
remarquer qu'ils peuvent être très supérieurs aux taux de mutation 
réels u et v). 


Du fait de la linéarité, il va nous suffire de la connaissance de 
la valeur moyenne q, et de la variance (1+f) p,qa/2N de la loi de pro- 
babilité conditionnelle de q', pour écrire les formules de récurrence 
qui unissent soit les valeurs moyennes, soit les variances, des lois 
de probabilité a priori des fréquences dans les générations succes- 
sives. Si nous convenons de désigner chaque moyenne a priori par la 
lettre correspondance surlignée, on obtient immédiatement (envertu 
du théorème dit ‘des moyennes conditionnelles" (1). 


(2) Leg = gate (qe rv(1:-.d) 


La limite, quand le nombre de générations écoulées augmente 
indéfiniment, de la moyenne à priori, s'obtient en faisant q' = q dans 


(2). Cette limite est donc C RE . Mais la formule (2) montre aussi 


+v 
que cette limite n'est atteinte que très lentement, car on a: 


— V 
———— 
q UE 


=(l-u -v)(T- ——) 


(1) La moyenne a priori de la moyenne conditionnelle d'une variable aléatoire 
est égale à la moyenne de cette aléatoire. ( 
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I1 faut donc un nombre de générations de l'ordre de grandeur de 


Pour diminuer de façon appréciable l'écart entre la moyenne q et 


sa limite C. 


Les résultats sont en accord avec ceux que nous avions établis 
(op.cit.),p.255, car, dans une population infiniment nombreuse, la 
fréquence q n'est pas aléatoire et ne diffère donc pas de sa valeur 
moyenne (notée ci-dessus q). 


Mais dans le modèle stochastique ‘'à effectif limité", que nous 
étudions présentement, l'ordre de grandeur de l'écart entre la fréquence 
q et sa moyenne q sera fourni par la ‘variance à priori (q - q)? dont 
la variation au cours des générations peut se déduire de la formule: 


q'- q'=q'i- q, +qu=q =qliq hifliu- v)i(qa) 


La moyenne conditionnelle (quand q est connu) du carré du ler 
membre, est en effet la somme de la variance conditionnelle (1+f) P,d,/ 2N 
du 2ème membre et du carré (1 -u -v}? (q - 4)/de sa moyenne con- 
ditionnelle. En prenant les moyennes à priori, on obtient : 


(q'-d')?=(1+f)p.a/2N+(1-u-v)(q-œ) 


On en déduit aisément que la variance a priori tend vers une li- 
mite oc? dont on obtient la valeur numérique en remplaçant (q' - q')‘et 
(q - q ) par o? et en remarquant que, asymtotiquement : 


Pad C-C'-(1-u-vy'et 
ce qui fournit : 


156 1) (CNE 


(3) o? = 
EN (MEV) -2N (ur v} API) Ta) 


Cette formule montre que o qui caractérise la fluctuation de qau- 
tour de sa valeur moyenne quand celle-ci est stabilisée et égal à C- 
le 
est de l'ordre de grandeur de HNQUrvV)ritf quand (u+v) est 
petit. 


o est donc d'autant plus grand queu +v, somme des ‘taux de 


: : 1 
mutation'"', est petit par rapport à -inverse de l'effectif" de la po- 


lation-, 
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Un cas particulier important est celui où u + v est pratiquement 
négligeable, c'est-à-dire où les mutations sont sans effet statistique, 
même au cours d'un très grand nombre de générations. Dans ce cas la 
formule (2) (avec u = v = 0) donne q' = q, donc la valeur moyenne à 
priori reste constante et égale à la valeur initiale q,, On a donc C:= 4 
et la formule asymptotique (3) se réduit à o? = C - C?, ce qui impose 
à la fréquence q d'être une aléatoire n'ayant comme valeurs possibles 
que 1 ou 0 avec les probabilités respectives C = q, et 1 - C = 1- q,. La 
signification pratique de ce résultat est la suivante : alors que, initia- 
lement, les deux gènes a et À coexistaient dans la population (avec 
des fréquences respectives q,et 1-q.), l'effet de hasard" finit à la lon- 
gue par faire disparaître complètement l'un de ces gènes (qu'aucune mu- 
tation, par hypothèse, ne réintroduit de façon durable), de sorte que 
l'état asymptotique est un état d'''homogénéité génétique!" où un seul et 
même allèle figure dans les loci de tous les individus. Toutefois, la 
nature de cet allèle unique reste à priori aléatoire : le résultat que 
nous avons obtenu signifie qu'il y a, à priori, une probabilité q, pour 
que ce soit l'allèle a. 


Appliquons ceci aux groupes sanguins : les taux de mutation des 
gènes O, À, B, l'un en l'autre, sont assez faibles pour que la trans- 
mission de ces gènes soit à la base des ‘recherches de paternité" ; 
or, il est frappant de vérifier que les populations restées pratiquement 
isolées durant une longue période (les Amérindiens, par exemple) pré- 
sentent, en ce qui concerne ces gènes, une quasi homogénéité (si cette 
homogénéité consiste le plus souvent en une présence exclusive du gè- 
ne 0, cela tient peut-être à ce qu'il est, en moyenne, le plus fréquent 
dans l'espèce humaine actuelle, et qu'il l'était peut-être aussi pour le 
groupe humain initial d'où dérivent, par ségrégation, les races actuel- 
les). Le fait que l'hétérogénéité persiste, par contre, sur l'ensemble 
du globe, doit être attribué à ce que les taux de mutation, quoique né- 
gligeables par rapport à l'inverse de l'effectif d'un groupe isolé, ne 
sont plus négligeables par rapport à l'inverse de l'effectif de la popu- 
lation totale du globe, pour laquelle N (u+v)est alors appréciable, ce 
qui, d'après la formule (3), entraîne pour o? une valeur nettement in- 
férieure à celle (C - C°) qui implique l'homogénéité (on doit se souve- 
nir que, plus c?est petit, plus la fréquence aléatoire qest, avec grande 
probabilité, voisine de sa moyenne C -qui est > 0 et < 1- donc plus as- 
suré est le maintien de l'hétérogénéité). 


Remarquons que notre raisonnement, quoique ne supposant pas 
qu'il y ait panmixie -nous avons introduit une 'corrélation gamétique" f- 
à l'inconvénient de n'introduire, comme fréquence q,que la fréquence 
globale dans toute la population, ou bien la fréquence dans un groupe 
complètement isolé. Si l'on veut étudier la répartition des fréquences, 
dans des groupes partiellement isolés qui échangent quelques individus 
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par migration, il faudra recourir à un autre modèle que nous expose- 
rons ci-dessous $ D (pour le généraliser ensuite au paragraphe F).Pour 
préparer notre étude, que Îa notion de "coefficient de parenté” rendra 
assez intuitive, nous allons traiter d'abord un cas simple : 


B - CAS PARTICULIER : COEFFICIENT DE PARENTE DANS 
UN GROUPE PANMICTIQUE ISOLE (sans sélection). 


Nous avons défini (op.cit. p.246) le ‘'coefficient de parenté" de 
deux individus I, et I,. Le "coefficient de consanguinité" de tout indivi- 
du se ramène, (à moins d'altération du gène par mutation dans sa 
transmission de parent à enfant), au coefficient de parenté de son père 
et de sa mère, ou encore, en vertu de notre hypothèse de panmixie, 
au coefficient de parenté de deux individus quelconques du groupe ; ces 
individus I, et I, sont naturellement supposés pris dans la même géné- 
ration, que nous noterons F, (qu'ils soient de sexes différents ou de 
même sexe n'influe pas sur les probabilités, puisque nous nous bor- 
nons à considérer des gènes autosomaux). Mais le coefficient de paren- 
té "'à priori ', évalué d'après la seule connaissance de la ‘génération 
initiale" E , ne peut être calculé qu'en regardant I, et I, commeprisau 
hasard dans la génération F,, ou encore en regardant leurs parents 
respectifs comme pris au hasard dans la génération F,.,. 


Lespères, par exemple, de I, et I, ont donc une certaine proba- 
bilité de coincider : cette probabilité est égale à la probabilité pour que 
deux gamètes mâles, pris au hasard parmi tous les gamètes utiles qui 
donnent naissance à F,, soient produits par le même individu ; d'après 


notre hypothèse de “fécondité poissonnienne'', cette probabilité est 


Nn étant le nombre de pères" distincts figurant dans la génération 
F,, ;ilen résulte que la probabilité pour que les pères de I, et I, soient 


deux individus distincts -J, etJ, -de F,.,, est 1 -— Définissons donc 


comme coefficient de parenté dans la génération F, (1), et notons qe, 


la probabilité à priori pour que deux loci homologues quelconques, pris 
au hasard chez deux individus distincts I.et I,de F,, dérivent,sans avoir 
subi de mutation, d'un même locus d'un ancêtre commun : nous quali- 
fierons dorénavant d'''identiques'' de tels loci ; le coefficient de consan- 
guinité d'un individu quelconque de F,,, s'écrit alors f,,, = (1 - u)É Ps 
u étant une moyenne convenablement définie des deux taux de mutation 
u et v introduits précédemment (2), Et la probabilité pour que I,etI, 


(1) dans "Population", 1955, p.246, nous avions défini le coefficient de parenté 
de deux individus donnés, reliés par des chaînes de parenté connues. Dans le 
présent article, il s'agit d'individus et de chaînes de parenté aléatoires. 


(2) Nous n'insistons pas sur la définition de cette moyenne, car il faut tenir 
compte de ce que la réalisation successive, sur une même chaîne de parenté, 
de 2 mutations inverses rétablit le gène primitif ; une étude détaillée sera 
faite dans un prochain mémoire. 


LES MODÈLES STOCHASTIQUES EN GÉNÉTIQUE DE POPULATION 181 


1 


aient reçu deux loci "identiques" de deux pèresdistincts sera — +0 FRE 
(1-u)° > alors que la probabilité PE qu'ils aient ok deux loci 


Lie 
up rt, En tenant 


identiques" d'un même père sera : FU = 


compte de ce que deux loci identiques D euvet provenir aussi de deux 
mères distinctes, ou d'une même mère, ou respectivement d'un père 
et d'une mère (forcément distincts) (1), on obtient : 


1 1 SR Dal 
D PLEIN n=l = EE -——— = 2 
Sn a ui lon ne 


Si l'on désigne par N' la moyenne harmonique de 2 N, et 2 N, (N' dé- 
signe donc l'effectif total en adultes reproducteurs, dans le cas parti- 
culier où les effectifs N, et N; des deux sexes sont égaux ; dans le cas 


général, il sera commode d'appeler N' l'effectif génétique) ; et si l'on 
remplace f,, par (1-u)?9,,, ona: 


ul unes 


J'ai indiqué ailleurs (2) comment on résout cette ‘'récurrence linéaire" 
Quand le rang n de la génération augmente indéfiniment, +, tend vers 
une limite ? , qui, étant alors indépendante de n, est fournie immédiate- 
ment par l'équation linéaire (4). Bornons-nous à écrire sa ‘partie 
principale" (quand u” est négligeable) : 


jl 


PR —— 
=} L'A4N'U 


Cette formule (5) est, malgré l'apparente différence de points de vue, 
très proche de la formule (3) : 


1/ Si u est négligeable par rapport à— . onoprient if scerti= 


tude (asymptotique) d'identité des gènes, donc certitude d'homogénéité. 


(1) Hormis les cas d'''hermaphrodisme"' ou de "plantes monoïques'' où les formu- 
les nécessitent des corrections (d'ailleurs aisées). 


(2) "Les mathématiques et l'hérédité" (Masson & Cie), p.35 ; l'équation y est 
‘écrite pour f et non pour. 
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2/ dans le cas général, imaginons que l'expérience soit poursui- 
vie indéfinimént, sur un grand nombre de groupes panmictiques isolés 
de même effectif; la probabilité à priori, pour qu'un locus quelconque 
d'une génération future très éloignée porte le gène a, sera la constante 
que nous avons appelée C, et la probabilité à priori pour que deux loci 
homologues de 2 individus quelconques de la même génération (très 
éloignée), dans un même groupe panmictique, soient identiques -ou, 
encore, au facteur (1 -u }? près, la probabilité pour que les deux loci 
homologues d'un même individu K d'une génération F, très éloignée, 
soient identiques- n'est autre que ?. 


Les probabilités à priori pour que l'individu K soit de génotype 
aa, aA, AA sont donc, (op. cit., p. 246). 


R=C'#9C (120) 20 = 241026) CET C) PIC re Ne) 


Cependant, dans chacun des groupes, etenraison de la panmixie, 
les fréquences réelles des 3 génotypes dans la génération F#, seront 
(si du moins l'effectif n'est pas petit), voisines de q?, 2p,q;, pÎ, l'in- 
dice i et la fréquence réelle q, de a, variant d'un groupe à l'autre sui- 
vant la loi de probabilité asymptotique étudiée en A. (Les fréquences q;, 
représentent donc les résultats d'épreuves indépendantes effectuées 
sur la variable aléatoire, dont la loi de probabilité à priori a été étudiée 
au paragraphe A). Les moyennes arithmétiques sur l'ensemble des 
groupes, des fréquences réelles q, et q? du gène a et du génotype aa, 
devront être voisines des probabilités CetR; en reprenant (avec des N: 
tous égaux) le calcul fait dans la 1ère partie (p.253), on constate que 
la différence 1 = R- C’?, doit être voisine de la ‘'variance statistique" 
des fréquences q;; on obtient donc, pour valeur 222rochée de cette va- 
riance : 


LE RCE Cu Mon Eee) 


ER NI 


Cela concorde bien, (quand u” est négligeable), avec la variance de 
l'aléatoire q, c'est-à-dire avec la formule (3). (Toutefois N' désigne 
maintenant la demi-moyenne harmonique des effectifs adultes des deux 
sexes, alors que N désignait l'effectif total à la naissance ; en outre, 
le remplacement deu + v par u sera expliqué dans une note du para- 
graphe F). 


I1 est utile de souligner, une fois de plus, la coexistence d'une 
panmixie (croisement au hasard) à l'intérieur de chaque groupe et d'un 
coefficient de consanguinité ? > 0 dû à ce que les ancêtres d'un indi- 
vidu K, appartenant par hypothèse au même groupe isolé d'effectif li- 
mité, ne peuvent être tous distincts ; il est remarquable que ce coef- 
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ficient caractérise aussi la variance de la fréquence, sur un ensemble 
nombreux de groupes isolés. Il sera important de reprendre cette ana- 
lyse, (ci-dessous, en D), dans le cas de groupes non complètement 
isolés, entre lesquels il y a migration. 


C - CAS DE GENES NEUTRES AVEC MUTATIONS ET MIGRA- 
TIONS ENTRE DEUX GROUPES PANMICTIQUES G, ET 
ca 


Nous utiliserons les mêmes notations qu'en B, mais en faisant 
précéder des indices 1 et 2 les quantités (en particulier les effectifs) 
correspondant aux groupes G, et G,. Il y a lieu de distinguer les taux 
de mutation moyens ,u et,u dans les deux groupes, car le calcul sera 
alors applicable au cas d'un groupe exposé à des radiations atomiques, 
et échangeant des individus avec un autre groupe non exposé (donc à 
taux de mutation moindres). 


Nous supposerons{cf.(op.cit.), p.250]que la probabilitépour qu'un 
enfant naissant dans le groupe G:; ait un père -ou une mère- né dans le 
groupe G, soit 1,, (puisqu'il n'y a que 2 groupes 1,; +1,; = 1). 


Nous appellerons 9,. (n) le coefficient de parenté (défini comme 
en Bjde 2 individus distincts I, et I, de la génération F prisauhasard 
parmi ceux qui se reproduisent dans les groupes G; et G; (1); la pro- 
babilité pour que I, et I, soient nés respectivement dans les groupes G, 
et G: est Lx; lnji ils ne peuvent avoir de parent commun que sih=ket 
la probabilité pour qu'ils aient le même père est donc : 


1 
1, 1,:+—=—1,, 
Ne Y 1) Ne 
Il en résulte que la probabilité pour qu'ils aient reçu deux loci ‘'iuen- 
tiques'' d'un même père est : 


1 1 1+9,(n-2) 1 1+9,,(n-2) 
Rue pil ne ln Sr, ed L,, — 2 


alors que la probabilité pour qu'ils aient reçu deux loci identiques" de 
deux pères distincts est : 


(1) I1 sera commode de supposer 9; évalué après toute mutation éventuellement 
produite dans le germende I, et I, pour les environnements des groupes G:; 
et Gÿe a 
9;; sera dorénavant appelé le ‘coefficient de parenté des groupes G; et G; , 
et iile "coefficient de consanguinité du groupe G;”. 
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zU- TU) DES j V2 (n-1).+ 13 L; P21 (n- + (= )iu at b; Pu(n-1)+ 


—) 
ER | LEee 
( Nm 2 EAN 


En désignant par ,N'et ,N'les ‘'effectifs génétiques" des deux groupes 
on obtient une récurrence qui s'écrit plus brièvement : 


a 1 1 +P1r(n72) 
Pi; (n) ee U) (1 = fs Li 1; Prh (n=1) + NN Li l, 1j a 


9, (nn | + _ lle ie Pro mu} | , 
) 2 


Nous avons montré (1) que ces coefficients de parenté tendent 


vers des limites ?;;. Ces limites sont données par le système linéaire : 


_ \ 1 1-1 jl 1 - P22 
(6) 9; (1-;u) auf Lki ls; Ph din Li M nn il L; 2 


toujours résoluble, mais dont la solution nécessite trop d'écritures 
pour que nous la donnions dans le cas général. Nous nous bornerons 
au cas particulier où le groupe panmictique G, est suffisamment vaste 
pour que son coefficient de consanguinité®,, , et son coefficient de pa- 


renté ?,, avec G,, soient négligeables, ainsi d'ailleurs que _. 
2 


En désignant [comme en (1), p.252] par m le coefficient d'im- 
migration de G, dans G;, onal1,, = met 1,, = 1-m, et la formule (6) 
donne simplement le coefficient de consanguinité Ÿ., dans le groupe G.: 


dns nn 
%ù = (1- ju)? (1 - my [us + LE | 


Si l'on suppose que m? soit, comme ,u?, négligeable, cette for- 
mule se réduit simplement à : 


1 
(ri À mere 
(7) fu 1+4;N! Çu +m) 


(1) Annales de l'Université de Lyon, A, 1950, p.48, et 1951, p. 90 et 105 à 107. 
(I1 y a lieu de remplacer (1 -u)2par (1 - UN GES ;ju)pour tenir compte de la 
variation du taux de mutation d'un groupe à l'autre). 
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quin'est autre que l'extension de la formule (5) au cas où, à l'effet des 
mutations, se superpose l'effet d'une immigration constante en prove- 
nance d'un groupe très vaste. Pratiquement, il arrivera rarement que 
le taux de mutation ,u dans le groupe G,, soit aussi du même ordre de 
grandeur que le “taux d'immigration" m ; c'est donc en général ce dernier 
qui déterminera la consanguinité dans le groupe G, (dans le cas con- 
traire, d'ailleurs, le coefficient de consanguinité serait diminué par 
les mutations). Si nous appliquons ceci à un groupe G; exposé à des 
radiations atomiques, nous constatons que le danger dû à l'augmenta- 
tion des taux de mutation, ne réside pas dans la consanguinité du groupe 
(qui n'est pas augmentée), mais dans l'augmentation au sein du groupe 
de la fréquence d'équilibre C de chaque gène néfaste : la formule (C 4), 
donnée dars ‘'Population" (p.254), ne s'appliquait que si les taux de mu- 
tation (désignés alors paruet v) étaient les mêmes dans tous les grou- 
pes ; par contre, dans le cas présentement étudié, la fréquence q, de 
a dans le groupe G, est différente de la fréquence d'équilibre C dans le 
groupe G, : cette dernière est en général plus grande, car elle est égale 
{ d'après la remarque de Population" p.260 ] a: 


1v' Du NAN els 


! ! 
;u DEV UD VAE 


: 


quantité qui est supérieure à q, si (1 - q,) v > ,uq,, ce qui a lieu si le 
gène a est suffisamment rare dans l'ensemble de la population. Si donc 
la probabilité R= C? +9 C (1 - C) des homozygotes aa -seuls porteurs 
de tares quand celles-ci sont compiètement recessives- est augmentée 
dans le groupe G, par les mutations provoquées, cela tient bien à la 
seule augmentation de C, et non à une auÿmentation du coefficient de 
consanguinité ?. Une mesure ‘'eugénique' d'un intérêt évident pour 
combattre les tares récessives d'origine atomique, consiste en l'aug- 
mentation du taux d'immigration m dans le groupe ‘'exposé" G, (en 
particulier par le choix des conjoints à l'extérieur de ce groupe), aug- 
- _1V + mq, 


mentation qui a pour effet de diminuer à la fois C = = et 
QUE VIN 
1 


Ms 1+4,N Qu+m) 
mente le danger pour l'ensemble de la population, dans laquelle le gène 
néfaste se diffuse par sortie hors du groupe G, ; de toutes façons le 
danger total est (à longue échéance d'ailleurs), proportionnel, d'après 
Population", p.261 - au taux de mutation moyen v du gène normal À 
en le gène ‘taré''a, donc au nombre total de roentgens absorbé partous 
les individus : cen'est que la répartition du risque entre les différentes 
familles qui se modifie suivant le degré d'isolement ou de renouvelle- 
ment). 


(I1 est manifeste que, en contrepartie, cela aug- 
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D - CAS DE GENES NEUTRES AVEC TAUX DE MUTATION 
CONSTANTS ET MIGRATIONS CONSTANTES ENTRE DE 
NOMBREUX GROUPES PANMICTIQUES EGAUX. 


Désignons les groupes par G,;, G,, ... G;, ..., G;...et soit N' 
la valeur (supposée constante) de l'effectif génétique de chaque groupe ; 
soit u le taux de mutation moyen (supposé maintenant le même pour 
tous les groupes). Le raisonnement fait en C) peut être repris (avec 
suppression des indices inutiles) et conduit à une formule qui est une 
généralisation de (6) (en ce sens que le crochet comporte maintenant 
autant de termes en qu'il y a de groupes, chacun de ces termes 
correspondant à l'éventualité d'un parent commun dans le groupe cor- 
respondant). Sous forme condensée, cette formule s'écrit : 


1 « 12? 
Past =) Ps + a lus 
(8) ij (1 u) Ë Le l;; kh N' Se 1;; l;; 2 | 


J'ai indiqué (1) ja résolution de ce système linéaire, par la mé- 
thode des fonctions génératrices, dans le cas où les groupes sont ‘'ré- 
gulièrement disposés" sur une ligne, ou sur une surface, et où chacun 
des taux d'immigration 1,; ne dépend que de la distance des groupes G, 
et G;. Le principal résultat de cette étude est de montrer que le coef- 
ficient de parenté ?.;, entre les groupes G:; et G; est une fonction expo- 
nentielle (décroissante) de la distance de ces groupes. 


Nous allons étudier en dé- 
tail le cas particulier où les 


groupes sont régulièrement dis- 


posés sur une droite D, chacun 
étant repéré par son abscisse. 
Le coefficient de parenté entre 
deux groupes G; et G; dont la 
différence des abscisses est x 
seranoté (x) [p(x)est, puisque 
p(-x) =9 (x) une fonction "paire" du nombre algébrique x]. Le taux 
d'immigration" l,; est supposé être fonction seulement de l'excès (algé- 
brique) y de l'abscisse de G, sur celle de G:; : nous le noterons l(y) [ ’ 
taux d'immigration 1;; devra alors être notél(z) si z désigne l'excès 
algébrique de l'abscisse de G, sur celle de G;]. La formule (8) s'écrit 
alors : 


ROSE LACS TE LONG + 2-7) +9) (+2 1900) 


(1) Annales de l'Université de Lyon, A, 1950, p. 49 et 11. 
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Or, cette équation peut être transformée, par une méthode analogue à 
celle qui a gi à Kolmogoroff de déduire l'équation de la diffusion, 

à partir des l'aéplacements au hasard'' du mouvement brownien ; si 
nous regardons la variation de (x) en fonction de la distance x comme 
assez ‘régulière pour justifier l'existence de dérivées successives 
de la fonction ® (x), et si nous regardons les déplacements s'écartant 
beaucoup de . moyenne comme assez peu probables pour que, par 
rapport à la ‘variance de migration" o2= 2 1(y) (y - y)? [en posant 


Fe > 1(y) y],les moments centrés d'ordre npétieut J'y) (y-ÿ)" (h> 2) 


. + y 
soient négligeables, la formule de Taylor permet de remplacer 
Y'l(y)1(Z) ?(x + z - y) par l'approximation : 
y? 


> 1(y) 1 œ| (x) cp (z _ Y) p! (x) 3e > 2 y)°9 "1 c | 
yZ 
qui se réduit, compte tenu de ce que Ÿ l(y) = Ÿ l(z) = 1 et de ce que 


z-y peut s'écrire (z -y) - (y-Y), à :9 (x) na o"(x) 


L'équation (8')où les termes en u’, en uc’et en à peuvent être 


négligés, s'écrit alors : 


P S 
(8"') 2uP(x) -0° ?'"'(x) = et Ÿ l(z) l(x +2) 
HM=Ky1(o) 
Le 2ème membre représente -au facteur ur près-la proba- 


bilité pour deux individus séparés par la distance x, d'avoir dans la 
génération précédente un parent commun. Lorsque la distance x est 
assez grande pour que cette probabilité soit négligeable, l'équation (8) 
se réduit à une ‘'équation sans 2ème membre" à coefficients constants, 
dont la résolution est immédiate : deux solutions particulières pour 


P(x) sont e x et e es, le coefficient de parenté cherché, 


étant borné, ne peut être que proportionnel à la solution d'exposant né- 
gatif, on a donc : 


(x) = Ke” Va br] 


cette formule étant valable lorsque à (‘distance réduite" évaluée en 


prenant pour unité l'''écart type de migration''o) est assez grand. On 
voit ainsi qu'une diminution importante du coefficient de parenté ne 


l 
peut se produire que pour une ‘distance réduite" = de l'ordre de TE 
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c'est-à-dire de l'ordre de 1 000, si le taux de mutation u est de l'ordre 
de 107: quand le taux de mutation est faible, la décroissance à distance 
du coefficient de parenté est très lente. Plus généralement, la formule 
permet une évaluation approchée du taux de mutation u en remarquant 


qu'un accroissement de ‘distance réduite" égal à - entraîne sensi- 
2 \ u 


blement une diminution de moitié du coefficient de parenté. 


L'étude de l'équation (8'') quand + n'est pas grand -et en particu- 


lier la recherche ‘du coefficient de consanguinité ®(0)- est plus déli- 
cate (1), Une première méthode consiste à y remplacer la dérivée se- 


conde œ''(x) par la ‘différence seconde" _ [pg(x+h)-2p(x) +?(x-h)] 


en désignant par h la distance entre deux groupes voisins, et en suppo- 
sant, pour simplifier, que chaque groupe ne soit alimenté en immi- 
grants, à chaque génération, que par les deux groupes voisins, avec 
des probabilités respectives égales à m, de sorte que : l(o) =1-2m, 
1(h) = 1(-h) = m, etl(nh)=osiln|>1, on a alors y = 0, o?2=2mh?, 

et Y l(z) 1(x+z) = 0 dès que |x|>h, 


scheme; “Utandiaique Size (ze e2). 
G;,: G:, Gr ont pour parties principales (quand m 


est petit) 1 et 2 m. On peut alors cal- 


culer les valeurs ?(nh) par récurrence en faisant x = 0, h, 2h etc. , 
ce qui donne : 


2up(o) -2ml{p(h) -2p(o)+9(-h)] - +) 
2ug(h)-2m{9(2h)-29(h)+9#(0)] -2 m0) 


2uv(2h)-2m{#(3h)-2®(2h)+9(h)] = 0 etc. 


La lère équation fournit g (h) = ? (-h) en fonction de(o), la 2ème 
fournit g(2h) et ainsi de suite. Comme les équations, à partir de la 
3ème, sont homogènes, + (nh) doit être, pour n 73, de la forme Ik", k 
désignant la racine inférieure à 1 de l'équation k? - 2 ( = )k+1-=0 

_ : 
Ceciexige que ?(2h)et p(h) tels que les fournissent les deux premières 


(1) Une telle étude est indispensable, même si l'on ne veut que déterminer le 
facteur K que nous avons fait figurer dans l'expression asymptotique de æ(x). 
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équations, soient eux-mêmes dans le rapport k. On en déduit immé- 
diatement l'équation donnant + (0) : 


PL CU u 2 1 k 
pub at fo) Zim'IN ENm| (1-#). 


u 
Quand m et le rapport sont tous deux petits ,p(o) se réduit sensible- 


GW) 


1 
en (1): k 
ment à DB Ne! et(pour n>o)æ(nh) à À +8 N' VE (1);en reve 


a\| 
nant aux notations nh = x et 2 mh°= o?2et remplaçant . = = par 


SN ER ET 
e m = e © 


on obtient : 


En 
Le 80 143 nt VZuc/h 


la constante K introduite précédemment coïncide dans ce cas avec (0), 
dont l'expression s'interprète immédiatement comme le coefficient de 
consanguinité que présenterait le groupe panmictique isolé étudié au 
paragraphe B formule (5) si son effectif génétique était : 


200 m 
1 — ! PÉN Ee er ! 
N; N \É … 2N 1 


N! représente la dimension de l'''isolat”" (au sens de S. Wright) qui 
rendrait compte de la consanguinité + (o) qui se manifeste à l'intérieur 
de chaque groupe ; notre hypothèse que — est petit entraîne que N! est 


très supérieur à l'effectif génétique réel N' de chaque groupe. Mais il 
ne faudrait pas en conclure à une panmixie qui règnerait sur toute l'é- 


! ; N! 2 
tendue occupée par 3 groupes : cette étendue étant égale ar h= \E Oo, 


le coefficient de parenté entre deux individus séparés par cette der- 


nière distance est : 
2 > 
e C2 0) = 6729 (0) # Loto). 


Les résultats numériques que nous venons d'indiquer, dépendent 


(1) Il ya lieu de remarquer que æ(nh) reste très voisin de # (0) tant que l'entier n 
n'est pas grand. 
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beaucoup moins qu'on ne pourrait le craindre de la loi de migration 
particulière et discontinue que nous avons adoptée pour résoudre expli- 


citement l'équation (8"'); seul importe au premier chef, le nombre de 


dimensions dans lequel s'effectuent les migrations. Si l'on conserve 
l'hypothèse de déplacement dans une dimension, sur'une droite, par 
exemple, mais que l'on adopte une loi de migration continue, gaussien- 
ne, d'écart-type o, la somme dans le 2ème membre de (8'') est le "pro- 
duit de composition" (multiplié par dx) de deux telles lois de gauss, 
c'est-à-dire CITE dx et N' doit être remplacé par 5dx,5 
ro V2 
désignant la ‘densité linéaire" de l'effectif génétique ; l'équation peut 
alors se résoudre en appliquant aux deux membres une ‘'transforma- 


+ 


tion de Fourier"! : la transformée G{t) = | eit* (x) dx vérifie alors 
- 
e 2x 
l'identité (2 u +o?t°) G(t) = 10) e ” *, et l'inversion de G(t) donne: 
; = (tx _O ve 
PE MIO: Co 
8 El ep at EE nee dt 


et il suffit de se reporter aux tables (1) des transformées de Fourier 
pour obtenir : 


(10) (KO) 2 [es tb dr 


46o \[2ur 


2u+ 


x 7» +00 2 
+ e2 Vu e”* dz | 


Compte tenu de la petitesse de u, ?(0) est alors sensiblement racine de 
l'équation : 


ce qui donne : 


11 = 
(a, CONTES 

RES 
alors que, quand ï est suffisamment grand pour que la dernière inté- 


grale figurant dans (10) soit négligeable, on obtient sensiblement : 


(1) Erdelyi, Magnus, etc., "tables of integral transforms", Mac Graw Hill. 
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1 - x Verre 
(12) DE me e” \?*5 VT = p(o)e ae 


Les formules (11) et (12), relatives aux 2 cas extrêmes où est nul ou 
og 


grand, se trouvent coïncider exactement avec la formule (9) établie 
dans le cas d'une loi de dispersion discontinue, à condition de substi- 
tuer dans celle-ci, à l'effectif moyen par unité de longueur‘! N'/h, la 
densité linéaire 5. 


L'examen que j'ai fait, dans un autre mémoire (1) au cas de la 
migration ‘'homogène'"'" suivant deux dimensions (migration ‘en surfa- 
ce"), fait apparaître que ?(x) conserve la même allure asymptotique 


X 2 : 
quand — est grand, mais que, par contre, sa valeur numérique quand 


x = 0 est assez différente de la valeur (11) obtenue dans le cas d'une 
seule dimension (migration ‘linéaire'"'). Cela tient à ce que la probabi- 
lité, pour deux individus voisins, d'avoir un ancêtre commun (plus ou 
moins éloigné dans le temps), dépend essentiellement, pour une même 
densité, dunombre de dimensions dans lequel ils se déplacent. L'effet 
cumulatif de différentiation (et par suite de diminution du coefficient 
de parenté) que produisent les mutations survenues dans chaque descen- 
dance de cet ancêtre commun dépend donc, lui aussi, du nombre de 
dimensions. Pour le cas d'une loi de migration continue gaussienne sui- 
vant deux dimensions, le coefficient de consanguinité (0) dépend du 
taux de mutation u, non plus par sa racine carrée, mais par son loga- 
rithme, suivant la formule : 


vos eri lisses (2) 
Homes at yaosEu) 


(os désigne l'écart-type de la composante parallèlement à une direction 
fixe du déplacement ; le ‘déplacement quadratique moyen" serait donc 
o V2). 

Alors que le coefficient de parenté à grande distance Fe grand) est 


régi par la formule : 


p (x) = VE 


(1) Annales de l'Université de Lyon, Math. 1950, p.52-et suiv. 


(2) L'augmentation du nombre de dimensions entraîne donc, pour une valeur don- 
née, de 2 50 ou de 2 50° (nombre d'individus dans un cercle ou un segment 
ayant pour rayon le déplacement quadratique moyen),une diminution de æ (0). 
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Par contre, il semble que la migration discontinue en surface, 


soit plus proche de la migration suivant une dimension que de la mi- 
gration continue suivant deux dimensions (1). 


Les formules que nous avons obtenues pour (0) et p(x) sont im- 
portantes, du fait qu'elles permettent de prévoir aisément les varian- 
cesetcovariances''intergroupes''", relatives aux fréquences q du gène 
a dans les différents groupes (ce que nous avions déjà constaté, en B, 
pour la variance sur un grand nombre de groupes complètement isolés ; 
mais la covariance entre deux groupes distincts était alors nulle). En 
effet, l'ensemble des loci homologues des individus constituant le 
groupe G;, peut être regardé comme résultant d'un ensemble de tira- 
ges au sort non indépendants, deux tirages quelconques ayant toujours 
la probabilité (0) de fournir deux loci identiques [et la probabilité 
1 - p(o) de fournir deux loci sans ancêtre commun ou altérés par mu- 
tations(2)]. Chaque locus ayant asymptotiquement [comme en BJ] la 
probabilité constante C de porter le gène a, la fréquence q, de ce gène 
dans le groupe G; aura la valeur moyenne C, et sa variance sera celle 
de la moyenne arithmétique d'un très grand nombre (3) de variables 
aléatoires, ayant chacune la probabilité C de prendre la valeur 1, et 
ayant, deux à deux, un coefficient de corrélation moyen égal à9(o) ; 
cette variance est C (1 - C) ?(0) (résultat à rapprocher de celui obtenu 
en B, et del'interprétation statistique donnée dans ‘'Population'', 1955, 
p.253, où C est remplacé par la moyenne générale des fréquences). 
Pour la même raison, la covariance entre les fréquences q, et qd; dans 
2 groupes distincts G;etG,, séparés par une distance x, est C(1-C)œ(x); 
p (x) 
p(0) 
(Nous avions déjà déterminé la covariance en 1948, dans le cas continu 
à 2 dimensions, dans notre livre" Les mathématiques de l'hérédité, 
p.60, note a) ; la décroissance exponentielle (à distance suffisante) de 
ce coefficient de corrélation, permet donc (comme Lamotte l'a souli- 
gné dans sa thèse sur les populations naturelles de Cepaea Nemoralis) 


d'où résulte que le coefficient de corrélation entre q, et q; est 


une détermination expérimentale de 2x ou de VE (voir $ F). 
© m 


Dans le cas d'un caractère "biométrique'', conditionné par plu- 


(1) Voir G. Malécot, op. cit. et M. Lamotte Bull. Biol. France et Belgique, 
suppl. 35. 


(2) loci que nous pouvons alors regarder comme indépendants, ce qui entraîne 
que le coefficient de corrélation moyen entre deux loci se réduit à (0). 


(3) à condition que soient suffisamment nombreux, non seulement l'effectif de 
chaque groupe G;, mais encore les individus qui y sont prélevés pour esti- 
mer la fréquence q;; dans le cas contraire, voir op. cit, 1950, p. 57. 
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sieurs couples de gènes allèles à effets additifs, (sans dominance ni 
epistasis), et si ces gènes sont supposés tous neutres et de taux de 
mutation sensiblement égaux, le coefficient de corrélationentre les 
valeurs de ce caractère, chez deux individus appartenant à des groupes 
séparés par une distance x, a une expression un peu différente : 


nie he (TE 


1 +9(0o) 


Nous pouvons conclure que la parenté qui existe entre les indi- 
vidus constituant des groupes d'effectifs limités et géographiquement 
rapprochés, entraîne, entre les fréquences dans ces groupes, aussi 
bien qu'entre les caractères biométriques de leurs individus, l'exis- 
tence de corrélations positives même dans l'état ‘'stationnaire'' asymp- 
totique (à la différence de ce que nous avions établi dans ‘'Popula- 
tion" (p.254 et 255), pour une population infiniment nombreuse où les 
fréquences finiraient à la longue par s'uniformiser, par un effet de 
moyenne, sur toute l'étendue occupée par l'espèce). La ‘'consanguinité 
de position" (2) présente donc, dans le cas présentement étudié, un 
caractère permanent ; elle doit, par suite, pouvoir être constatée expé- 
rimentalement dans toute population occupant une aire suffisamment 
étendue (que cette population soit continue, ou fragmentée en groupes 
panmictiques reliés par des courants de migration). 


Mais l'inconvénient du présent modèle est de ne pas tenir compte 
d'un autre facteur de différentiation entre groupes, facteur souvent 
plus important que les mutations : la sélection par les conditions loca- 
les. Cette nécessaire généralisation sera l'objet du paragraphe F, 
mais il nous faut, au préalable, donner quelques indications (paragra- 
phe E)sur l'effet de la sélection dans un groupe isolé. 


E - SELECTION ET MUTATIONS DANS UN GROUPE ISOLE. 


Reprenons les notations du paragraphe A, en désignant par q, et 
par w (q,) = Le la moyenne et la variance de la loi de probabilité 


conditionnelle de la fréquence q' du gène a dans F,,,, quand sa fréquence 
q dans F, est connue. q, s'exprime sous la forme q +5(q), la quantité 
5 (q) traduisant maintenant l'action combinée de la sélection et des mu- 
tations et étant fournie par la formule (D;) de la p.2. 


(1) Celatient à ce que la variance des individus n'est plus, comme celle des fré- 
quences des groupes, proportionnelle à (0), mais à 1 + (0) (le tirage d'un 
individu équivaut à celui de deux gènes allèles seulement). Pour les détails, 


voir op. cit. 1950,p.59. 
(2) M. Lamotte, op. cit. 
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Nous désignerons pee ®.(q) dq la probabilité a priori (probabilité 
qui ne dépend que de la “fréquence initiale" q, dans la génération F), 
pour que la fréquence dans F, appartienne à Poterie infiniment petit 
ga... q+ dq.o,,, (q')dq' désignera de même la ‘'probabilité élémentaire 
a Drioride la. fréquence dans F,,,. Si6(q'q') dq' représente la proba- 
bilité de passage de la valeur q aune valeur de l'intervalle q'... q'+ ad 
les règles des probabilités totales et composées donnent (après sim- 
plification par dq') : 


1 
G3) on (a!) = J. 8 (ae a') o, (a) da 


2 
Si nous désignons par F(s, n) = f e *® (q) dq la fonction carac- 


téristique (a priori) de la distribution de probabilité de q, il suffit de 
multiplier les deux membres de (13) par &°' dq' et d'intégrer pour ob- 
tenir (après interversion d'intégration) : 


ES An DE a 


ls 


Al É & 
f eee d') da |e ‘6, (q) da. 


0 


L'intégrale entre crochets pourrait être appelée, puisque la va- 
leur de q y est fixée, la ‘'fonction caractéristique conditionnelle" de 
l'accroissement aléatoire q'-q; elle fournit, par développement, sui- 
vant les puissances de s, les ‘moments conditionnels'' de cette aléa- 
toire ; le premier de ces moments n'est autre que q, - q, c'est-à-dire 


5(q) ; le deuxième moment n'est autre que o«(q.) + CS q) quantité que 
1 q 


+ _ 
nous réduirons à w(q) = 1 Ja 0 1 en supposant, avec Sewall 


1 

N° LV tr to W Soient des infiniment petits du même 
ordre de grandeur, et que leurs carrés et leurs produits mutuels soient 
négligeables (c'est une extension de l'hypothèse de ‘'faible sélection" 
faite dans "Population", p.257) ; ces hypothèses ont l'intérêt de ren- 
dre négligeables les moments d'ordre supérieur à 2, donc de réduire 


Wright, que 


2 
pratiquement la ‘fonction caractéristique conditionnée" à 1+55 (as w (q), 


ce qui donne alors : 


(14) F(s,n+1)= Jr eseu + Eu [eo, co ae 


Oo 


Le 2ème membre -où 5(q) et «(q) sont des polynomes en q- peut 
Si exprimer en fonction des dérivées partielles : 
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se, Dn(E nn) = [la et o,(a) da D) 


mais on peut aussi l'écrire, grâce à une intégration par parties : 


F(s,n)+s / 1/5 (a) o, (a) - al (a), o]} da 


(à condition que la fonction entre crochets soit nulle aux bornes 0 et 1). 


Quand la distribution asymptotique stationnaire, indiquée dans 
l'introductionest atteinte, F (s, n + 1) doit être identique à F (s, n), ce 
qui nécessite la nullité de l'accolade ; la distribution stationnaire de 
probabilité de q -distribution dont nous désignerons la densité par ® (q)- 
vérifie doné l'équation différentielle : 


«as 


L2: 
22,44 


w (q)® (q)] -5 (q) ® (q) = 


que l'on peut intégrer par : 


(15) al) (a) = K exp. | 2 SÉCRe a | 


w(q) 


1 


la constante K étant déterminé par la condition [ o (a) dq = 1. 


Ca 


En remplaçant 5(q) et w(q) par leurs expressions, on trouve : 


4 Nv 4 Nu 


ns 1 AN 
HO EsEk au t (ta) (ne ner]. .u-n+1e :) : 


(à condition que w(q)®(q) soit nulle aux bornes de l'intervalle 0... 1F*et 
que 6(q) soit intégrable dans cet intervalle, ce qui a lieu quand u et v 
sont tous deux > 0, c'est-à-dire quand chaque gène est passible de mu- 
tations ; dans le cas contraire oùil n'y a pas de mutations, la distribution 
asymptotique ne peut admettre de densité de probabilité, car il y a 
toujours extension à toute la population de l'un ou l'autre des gènes: q 
ne peut prendre asymptotiquement que les valeurs 0 ou 1, avec des 


(1) Ce qui est à l'origine de la méthode que j'ai exposée dans les ‘publications 
de l'Institut de Statistique de Paris'"', 1952, vol. 1, fase. 3, méthode qui per- 
met, dans le cas particulier de gènes neutres, le calcul successif de tous les 
moments (le calcul des moments d'ordre 1 et 2 à déjà été fait ci-dessus, 


paragraphe A). 
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probabilités qui dépendent cette fois, de la fréquence initiale q, (1), 


La formule (16), qui fut découverte (dans le cas où f = 0) par 
sewall Wright (2) est bien connue des biologistes, car elle fournit à la 
fois : la probabilité 6(q) dq pour qu'un gène donné a ait, dans un groupe 
isolé comprenant N individus et au bout d'un nombre suffisamment 
grand de générations, une fréquence comprise entre q et q + dq ; les 
proportions asymptotiques des différentes valeurs simultanées de la 
fréquence q sur un grand nombre de groupes isolés comprenant chacun 
N individus (en supposant fixes les coefficients de mutation et de sélec- 
tion) ; et même (d'après le théorème ‘'ergodique"') la distribution des 
valeurs de la fréquence q sur une très longue période, dans un seul 
groupe isolé. Des tentatives de vérification expérimentale de cette for- 
mule ont été faites (voir Lamotte, Bull. Biol. Fr. et Belg., suppl. 35, 
1951 ; Wright et Kerr, Evolution, 8, p.225). Les critiques de la for- 
mule (16), faites par l'Ecole de R. À. Fisher, contestent la validité de 
l'hypothèse de constance des coefficients de sélection dans le temps et 
dans l'espace (Fisher et Ford, Heredity, 1, p.143 et 4, p.117 ; Shep- 
pard, ‘Evolution as a process'"', p.201). Nous indiquerons ci-après le 
modèle de Kimura comportant une variation aléatoire dans le temps 
des coefficients de sélection dans un groupe isolé, puis, ci-dessous en 
F), notre schéma comportant une variation aléatoire de groupe à 
groupe. 


Mais nous rappellerons d'abord les conséquences classiques de 

la formule (16); sans discuter tous les 

o(q) cas possibles, nous nous bornerons à 
indiquer les 2 cas les plus importants : 


ler cas : taux de mutation u et v assez 
4 Nu 
1+f 


grands vis-à-vis de É pour que et 


N 
O L 4Nv 
q 1 fé] 1+f 


soient nettement plus grands que 1. 


(1) probabilités, dont j'ai établi les valeurs : 


ts LrrexpaediNo ON Ole) 
1EPPeMPE= 
PR INT TD 
en posant o=ft,+(1 - f)t {dans le cas particulier où w, = 0), dans le mémoire 
ci-dessus indiqué. 


(2) pour un aperçu des toutes dernières extensions de cette formule, consul- 
ter S. Wright, Cold Spring Harbor Symposia on quantitative biology, vol 
OS als à i 
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La courbe représentative de la densité o (q)est alors une ‘'courbe 
en cloche" et la distribution est concentrée dans le voisinage de la va- 
leur moyenne q qui est, par extension de ia formule (2) du paragraphe 
À, racine de l'équation 5(q) = 0. q ne serait autre que la valeur d'équi- 
libre (1) dans une population infiniment nombreuse, valeur étudiée dans 
un cas particulier, avec la notation y , dans ‘'Population'"" , p.260. La 
“fluctuation"" (dans un grand nombre de groupes isolés, ou au cours du 
temps dans un même groupe) des valeurs de q autour de 4 s'explique 
par les déviations que le tirage au sort des gamètes (‘'randomdrift''). 
ense répétant à chaque génération, provoque par rapport à la position 
d'équilibre q que tendent à imposer conjointement les ‘forces de rap- 
pel'' dues aux mutations et à la sélection, (rappelons que dans le para- 
graphe A), enl'absence de sélection, cette dispersion a pu être carac- 
térisée aisément par la variance de q). Quand il s'agit de fluctuations 
suffisamment petites autour de q, il est possible, en lère approxima- 
tion, de remplacer la "force de rappel" q, - q = 5(q) définie par la for- 
mule (D;) par une force de rappel linéaire" (2) de la forme q -q, =-h(q-a), 
la constante h étant (d'après la formule de Taylor) donnée par : 


d 5 (a) 


(17)h=- =u+tv-[ft+t.(1-f)] (1-2q9)-w(1-f)(2q4-3q). 


Cette remarque permet, entre autres, un calcul approché de la variance 
o? de q : il suffit d'utiliser le calcul qui avait été fait au paragraphe A 
dans le cas d'une force de rappel linéaire (cas particulier ‘'sans sélec- 
tion'':h= u + v) : o2 est donné par la formule (3), à condition d'y rem- 
placer u+v par h et C par q (dans le paragraphe F, cette méthode ap- 
prochée sera étendue au cas de groupes échangeant des individus par 
migration). 


: 1 
2ème cas : taux de mutation u et v assez petits par rapport à N Pour 


4ANu * 4aNv 
1+f 


rer soient plus petits que I. 


que 


Dans ce cas, la formule (16) montre que ®(q) devient infini pour 
qa=0et q = 1 : la constante K, est d'ailleurs d'autant plus petite que u 
et v sont plus petits. Ce sont les fréquences proches de q = 0 ou de 
q = 1 qui ont la plus forte probabilité. La petitesse des taux de muta- 
tion dans le cas que nous considérons, a donc pour conséquence que la 
plupart des gènes sont près de la fixation ou de la disparition (éventua- 


(1) Nous laissons de côté les cas (rarement rencontrés quend les coefficients de 
sélection sont fixes) où cette valeur d'équilibre n'est pas unique. 


(2) ce remplacement est d'ailleurs valable en toute rigueur dans le cas de gènes 
lneutres'', pour lesquels la force de rappel n'est due qu'aux mutations. 
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lités qui se produisent d'ailleurs de temps à autre); 

si la fixation ou la disparition ne sont pas perma- 

nentes, cala tient aux quelques mutations qui sur- 

(a) viennent de temps en temps dans un sens ou dans 

l'autre, ou bien à desimmigrations sporadiques s'il 

s'agit d'un groupe non complètement isolé (par 

exemple, s'il s'agit des peuplades primitives dont 

nous avons signalé, au paragraphe A), la quasi- 

C q homogénéité concernant le groupe sanguin). 
Modèle de Kimura. 


La sélection est seulement gamétique, t, et t, se réduisant à s-1 
et, à 0 ; mais le coefficient de sélection gamétique s, au lieu d'être 
constants, est aléatoire (de moyenne s, de variance V.)(\-/,. 


Si l'on note encore q, = q + &(q) la moyenne conditionnelle de q' 
(relatif à F,,,) quand q (relatif à F,) est connu, la formule D; donne, en 
y remplaçant le terme de sélection (aléatoire) par sa valeur moyenne : 


a, -q=56(q)=-uq+v(1-q)+(s- 1) q(1- q) 


Mais la variance conditionnelle de q' est maintenant la somme de la va- 
+ 
riance EP Eine au tirage au sort des gamètes, et de la variance 


V. q’(1 - q)° du terme aléatoire qui figure maintenant dans (D). En 
désignant par w(q) cette somme, la formule (15) reste valable pour dé- 
terminer la densité o(q) de la distribution stationnaire. Kimura a mon- 
tré (quand u = v) que la modification apportée à la forme de distribution 
par le caractère aléatoire de s, n'est importante que si VW dépasse 
l'ordre de grandeur de u ou de & : une distribution ‘'concentrée'' peut 
être remplacée par une distribution ‘'bimodale'"' (2) dans le cas où 
V. > 4u- (1/N) ; la fluctuation du coefficient de sélection a donc (qua- 
litativement) le même effet que la petitesse des taux de mutation. Pour 
les détails, nous renvoyons à son intéressant mémoire (qui indique 
également des extensions). 


(1) le mémoire de Kimura, dans “Cold Spring Haroor Symposium'', vol. XX, 
p. 39, désigne par s ce que nous notons s-1. 


. (2) la concentration de la densité vers les 2 extrêmes n'est toutefois pas exac- 
tement la même que dans une ‘distribution en U'', car la densité tombe à 
zéro pour les deux valeurs extrêmes : q = 0 et q = 1. 
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F - CAS DE MIGRATIONS CONSTANTES ENTRE DE NOM- 
BREUX GROUPES A TAUX DE MUTATION ET DE SELEC- 
TION VARIABLES. 


Nous désignerons -comme dans "Population", 1955, p.250- par 
l,; le pourcentage, à chaque génération, d'individus qui se reproduisent 
dans le groupe G; tout en étant nés eux-mêmes dans le groupe Gx. 


Nous désignerons par q, la fréquence du gène a parmi les gamè- 
tes utiles qui donnent naissance à la génération F, du groupe G, et par 
q' la fréquence de a parmi les gamètes utiles à l'origine de la généra- 
tion suivante F,,, du groupe G;. S'il n'y avait ni mutation ni sélection, 
la moyenne conditionnelle de q', quand les q, sont connus, serait sim- 
plement q;, = Ÿ 1,; q, ; mais cette valeur q., doit en réalité être modi- 


fiée par l'addition d'un terme 5,(q;,) qui traduit l'action combinée des 
mutations et de la sélection. 


Nous admettrons, d'une part, que ce terme ne dépend que des 
conditions régnant dans le groupe G:, d'autre part, qu'il est linéaire 
en d;,, donc de la forme : 


(18) den (den Ci) h; (LdC) 
k 
(h; se réduisant à u;+v; et C; a — dans le cas où il n'y a pas de sé- 


lection et où les taux de mutation dans le groupe G; sont des taux fixes 
ue): 


q! admet alors (quand les q, sont connus), la moyenne condition- 
nelle : 


(19) Qie & Art fn) =h.C,+(1-h)2l;q, 


La fluctuation de qi autour de q;. sera exprimée par la variance 
conditionnelle qui, si lestaux de mutation et de sélection étaient fixes, 
s'exprimerait -sous les hypothèses indiquées dans l'introduction- par 
C9 0 Ge), N; désigant le nombre d'individus (comptés à la 
naissance de la génération F,,,) dans le groupe G:;, et f; la corrélation 
gamétique dans ce groupe ; pour simplifier, nous réduirons cette va- 


riance à (usé at : Ain), ce qui est légitime si q;.-q;, est suffi- 
i 


(1) Nous avons indiqué dans le paragraphe E (ler cas) dans quel cas le rempla- 
cement du terme de sélection par un terme linéaire est légitime. 
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samment petit, donc si les taux de mutation et de sélection sont suffi- 
samment petits (1) 


Mais nous allons nous placer, plus généralement, dans "l'hypo- 
thèse de Kimura'', en admettant que les taux de mutation et de sélec- 
tion, au lieu d'être fixes dans chaque groupe, sont aléatoires : les 
quantités h; et C; que nous avons introduites dans la formule (18), cor- 
respondront alors seulement aux valeurs moyennes de ces taux dans le 
groupe G:; ; la variance conditionnelle est la somme du terme indiqué 
ci-dessus et d'un terme supplémentaire, traduisant la fluctuation des 
taux réels à chaque génération autour de leurs valeurs moyennes. Cette 
fluctuation peut être exprimée à l'aide de différentes hypothèses. L'une 
d'elles -assez justifiée- consiste à regarder l'expression réelle de 
5, (q,,) à chaque génération comme résultant de deux forces de rappel 
antagonistes, respectivement proportionnelles à 1 - q,,et q,,, les coef- 
ficients de proportionalité étant des variables aléatoires indépendan- 
tes v; et -u, de valeurs moyennes v, et - u, et de variances V, et V . 
La moyenne conditionnelle 5; (q,,) = q;, - q., de l'aléatoire q' - q,, est 
alors V;(1 - q;,) - u; q;,, elle est bien toujours donnée par la formule 
(18) à condition de poser h; = u; + v; et C; MEL Mais la variance 

! l 
conditionnelle sera maintenant, suivant un raisonnement analogue à 
celui de Kimura : 


(0) ei(as) = Qu) 4 y (1 - q,)2 + V, di, 


La formule (19) permet -en prenant les moyennes a priori des 
deux membres - d'obtenir la relation entre les moyennes a priori de 
deux générations consécutives. Elle définit en particulier les valeurs 
asymptotiques stationnaires q, de ces moyennes a priori par les équa- 
tions linéaires : 

(21) héh:C(LEROd 


k 


Le calcul des variances et covariances a priori se fait ensuite, 
-pour l'état stationnaire- en déduisant de (19) et (21), les formules : 


RG Te D SEE CR 


q: 4, = q' à qd". + (1 - h;) > 1, (da, - q,) 


I1 suffit de multiplier membre à membre, de prendre les moyen- 


(1) Cette approximationn'est pas indispensable, mais elle allège les écritures. 


LES MODÈLES STOCHASTIQUES EN GÉNÉTIQUE DE POPULATION 201 


nes conditionnelles [celles de did ide qi - q.,, et du produit de ces 
quantités par j # i sont nulles ; celle de (da +” est la quantité o, dé- 
finie par (20)], et de désigner par Vij les valeurs stationnaires des 
moyennes a priori des produits (q! - 4.) (q! - q) -moyennes qui sont 
les covariances- pour avoir : 


(22) Vi; = ÿ DE dv LS lo) 


avec : a (a) - [eu Gun a+ v a | 


et 5;; étant nul quand j # i.et égal à 1 dans le cas où j = i (c'est-à-dire 
dans le cas de la variance v:;). 


L'équation (22) -dont l'analogie de forme avec les équations (6) 
et (8) s'explique par la relation, soulignée à la fin du paragraphe B, 
entre variances et coefficients de parenté -peut être explicitement ré- 
solue dans les mêmes cas particuliers que l'équation (8), et met alors 
en évidence la décroissance de la covariance entre deux groupes G:; et 
G ; en fonction de leur distance. Mais, pour obtenir une formule statis- 
tiquement vérifiable, il faut tenir compte de ce que les moyennes a 
priori q:, différentes d'un groupe à l'autre, ne pourront qu'exception- 
nellement être déterminées individuellement (les fluctuations de la 
fréquence q' dans le groupe G; pouvant rarement être observées sur 
un nombre de générations suffisant pour estimer q;). Il faut donc con- 
sidérer, ORPES les covariances vi; par rapport aux moyennes vraies, 
mais les! ‘comoments' V,.= Ml(q!- a, ) (q' - q.)] HET Hg =) (q; 102) 
par rapport à une "moyenne conventionnelle" que nous notons CA Et 
ces comoments ne pourront être estimés (hormis le cas rare oùil serait 
possible d'étudier chaque couple de groupes pendant un nombre de gé- 
nérations suffisamment élevé) qu'à l'aide de moyennes arithmétiques 
de produits (q' - q) (a = qd.) formés à partir des fréquences q' et q° 
observées simultanément sur un Een nombre de couples de groupes 
Giet G situés à une distance donnée Ÿ x l'un de l'autre. Nous désigne- 
rons par y (x) une telle moyenne arithmétique, par ? (x) celle des cova- 
riances v;; correspondantes, et par u(x) celle des produits (q; - q.) (q;,-q.) 
correspondants. On a évidemment : 


(23) y(x) =? (x) + u (x). 


Nous nous placerons dans le cas où les groupes sont ‘'régulière- 
ment disposés" suivant le schéma exposé au paragraphe D dans le cas 
discontinu (1) lesimmigrants dans G; à chaque génération ne provenant 


(1) On den le même résultat dans le cas continu, à condition de rempla- 
cer 2mparo?etde substituer terme enbë,; qui figure dans le 2ème membre 
de (22), une ‘fonction de Dirac" 
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-dans un pourcentage m- que de chacun des deux groupes voisins (dont 
la distance à G; sera maintenant, pour simplifier, prise pourunité, 
quitte à rétablir ultérieurement l'homogénéité des formules, pour com- 
parer avec les résultats du paragraphe D où cette distance était no- 
tée h). L'équation (22) donne alors, en remplaçant h;et h;,parune valeur 
moyenne que nous noterons dorénavant h, et en faisant les mêmes 
approximations que celles qui avaient permis de passer de (8') à A LE 


2h9(0)-4m{?(1)-#(0)] = 


2hw(1)-2m[?(2) - ?(1}] - 2 m[p(o)-(1)]=0 


…..... 


en désignant par w la moyenne arithmétique, sur tous les groupes uti- 
lisés de w.(q,,) : 


Ces équations linéaires sont -sauf la lère- sans second membre 
et fournissent donc pour g(n) une combinaison linéaire de k; et de k;, 
k, et k, étant les deux racines de ‘l'équation caractéristique", 


2mk°?-(4m+2h)k + 2m = 0 qui s'écrit encore : k?2 - @+2)k+ 140 


et admet une seule racine inférieure à 1, que nous noterons k,. Com- 
me ?(n) doit être borné, il doit être proportionnel à k;, et cela même 
pour n = 0 d'après la 2ème équation (24). On a alors p(n) =æ(0o) k:, et 
la 1ère équation (24) permet alors de calculer 9(o) par la formule : 


o 
P = ——————————— 
PNA NT UTE) 
Il sera commode, pour la simplicité des écritures, de supposer doré- 
navant que le taux h (qui caractérise grossièrement l'intensité de la 
mutation et de la sélection) soit petit % ou ‘'taux de mutation'' m (1). 


h 
On peut alors remplacer k, par 1 - Fe et récrire p(n) = (0) k! sous 
la forme : 


(1) Cette hypothèse n'est pas indispensable ; les formules pourraient être écrites 
en s'en affranchissant, mais cela au prix de quelques longueurs. (cf. G. 
Malécot. Communication à la 31ème session de l'Institut International de 
Statistique, Bruxelles 1958). 
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(25) o_,-"\f 


Den 


s peut d'ailleurs être formulé, dans l'hypothèse où tous les groupes 
ont le même effectif Ni = N, la même corrélation gamétique f, = f, et 
les mêmes variances V, et V, de leurs coefficients u, et v, et en dési- 
gnant par M, et M, les moyennes arithmétiques, sur tous les groupes 
utilisés, des quantités q,, et q°, (quantités que l'on peut elles-mêmes 
assimiler respectivement à q; et à q? = (q.,)? HV) 0 a, alors: 


(LT) (te 
(26) © AURA RUE Re em (Lus2 M +iM;) 


2N 


Comme M, dépend -d'ailleurs linéairement- de la moyenne arith- 
métique des v:;,.qui est p(o), on voit que p (0) serait donné, comme au 
paragraphe D, par une équation linéaire ; nous ne la formerons pas ; 
puisque la fonction pratiquement observable est la fonction y(x), il nous 
suffira de former, à la fin de notre étude, l'équation -de forme analo- 
gue- donnant y(o). D'après les équations (23) et (25), la détermination 
de y (x) est maintenant ramenée à celle de la fonction (x). 


u (x) étant la moyenne arithmétique des produits (aq; - q.) (a, S a) 
correspondant à j - i = x, l'équation (21) (où l'on remplace h; par la 
valeur moyenne h et 1,;, par m quand |k -i|= 1 et par 1-2 m quand 
k =" =10) fournit. 


u(x) =h moyenne des [C; - q,) (q; - q.)1+ (1-h)[(1-2m) u(x) + 
(SE) ER UOTE El) 2) 


mais la résolution de cette récurrence nécessite la connaissance de la 
fonction de j-i = x quiest la moyenne arithmétique des (C; - q.) (4, - 4). 
Nous noterons 8 (x) cette fonction et écrirons la récurrence précédente 
(en y négligeant le produit mh vis-à-vis de m) sous la forme : 


(27)  hy(x)-m [u(x+ 1) - 2u(x) +u(x- 1)]= h0(x). 


Cette récurrence avec 2ème membre ne peut être résolue que 
moyennant une détermination préalable de la fonction 6 (x). Or celle-ci 
vérifie une récurrence sans 2ème membre que l'on obtient à partir de 
(21) [par soustraction de 4, multiplication par (C; - q,), et prise des 
moyennes arithmétiques] (1) : 


(1) 0 (x) est une fonction paire (invariante quand on échange i et j) du fait de la 
formule (27) et du fait que u(x) est, d'après sa définition même, une fonction 
paire. 
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8 (X) = h moyenne des [(C:- de) (CR qa)l+(1-h)((1-2m)0(x) + 


En OL OMNEEMNIENEENT)EI 


V: 
Si l'on admet que les variations des constantes C; - nl d'un 
groupe à l'autre ne sont pas influencées par la proximité géographique 
et ont donc dans l'espace géographique un caractère ‘'purement aléa- 


toire"(1l) et si l'on particularise la ‘moyenne conventionnelle" q, en la 
prenant égale à la moyenne arithmétique des C; (ou, ce qui revient au 


même d'après (21), à la moyenne arithmétique des q., que l'on peut 
estimer par la moyenne arithmétique des q' observés dans les diffé- 
rents groupes), la moyenne arithmétique des produits (C; - q) (C; - qe) 
n'est différente de zéro, et égale alors à la moyenne des (C; - q)? que 
nous désignerons par of, que quand j = i, c'est-à-dire quand x = 0. On 
a alors : 


(28) he(x)}-mle(x+1)-26(x) +6(x- 1)] =0 


sauf pour la valeur x = 0 qui donne he (0) - 2 m [8(1) -8(o)] = hof. La 
résolution se fait par les mêmes formules que pour (24) où il suffit de 
remplacer w par 2 h o?. On obtient : 


(29) 0(x) = \ Dote FN 


L'équation (27) peut alors être résolue ; mais du fait que son 
2ème membre h8 (x) se trouve être une solution particulière de l'équa- 
tion sans 2ème membre, on doit chercher la solution de (27) sous la 
forme : 


(30) H(R} Sen le panes AE 


On détermine le coefficient « par substitution dans (27), ce qui 
donne : 


(30!) = 0! 


(1) C'est l'hypothèse de ‘sélection par les micromilieux'' de Sheppard et Cain, 
Dans le cas contraire où la proximité géographique créerait une corrélation 
entre les C;, on pourrait introduire dans (28) des seconds membres propor- 
tionnels à cette corrélation, mais on doit, de toutes façons, exclure le cas où 
la variation des C; présenterait un gradient géographique (''cline"'). 
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et le coefficient B n'est autre que u (0) [qui est par définition de u(x) 
moyenne arithmétique des {q; - q,)? et se calcule à l'aide de la formu 
(27) pour x=0:hu(o) - 2mlu(1) - u(o) ] = h 8(o);compte tenu de l'c 


: ; h 
pression (30) qui donne (pour = petit) u(1) = u(o) = « - 2 B on trouve : 
LA 1 h 
(30 ) EN Em” 


On peut alorstirer des équations (23) et (25) l'expression de y (x): 


(1) v (9) n. +Ix| Jen 


© 
4 rm 


Mais cette formule ne permet pas à elle seule de calculer 


© +h o2 L- 
y(o)= " ai car w dépend de (0) : en vertu de (26) où l'on remplace 


M, par q,et M,par q+vw(o) (1) x s'écrit : 


Lt 


Ro . — - 
DANCE ONE 0) Hate) er rire Ve sb Vea it (G): 


2N 


y (0) est donc fourni par une équation du ler degré qui donne : 


Ie _ En” Er? : 
SN died )rv do TEN (ARTE TE Ne 
(32) y (0) = 1 0 
TN * DAV NE AV? 


et y(x) admet alors l'expression [ plus simple que (31) ] : 
3 =: pale Ql'E 
( 3) y(x) = [A (o) X FR ue e 


Ces expressions englobent comme cas particulier celles qui 
avaient été obtenues dans les modèles précédemment considérés. 


1/ Sil'on suppose que les taux u; et v: qui définissent les l'forces 
de rappel linéaires'' (2) sont constants dans le temps (V, = V, =0)et 


= — indépendant de i, donc 


! ! Fr — 
constants d'un groupe à l'autre (C; un + v. 


(1) CR est la moyenne des quantités q,,, et leur variance est (à un terme de l'or- 
dre de m près) égale à y(o). 


(2) Rappelons que ces taux tiennent compte à la fois de la mutation et (approxi- 
mativement) de la sélection dans chaque groupe. 
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— = h 
: dal - x] | à 
os? = 0), on obtient la formule (33') y(x) = ——- TC analo- 


; n 
gue à celles du paragraphe D, et qui se ramène, quand Lei est petit, à 


celle que j'avais indiquée en 1949 (1) (Colloque de Lyon sur le Calcul 
des Probabilités, éditions du C.N.R.S.) et qui a été utilisée par 
Lamotte (2) pour déterminer, pour le gène, ‘absence de bandes" des 
RUE 
aux pressions internes dans chaque groupe et le coefficient de migra- 
tion(u). Enprenant pour unité d'évaluation de la distance x le kilomè- 
tre, qui est aussi la distance moyenne entre deux ‘'colonies" voisines, 


Cepaea, le rapport 2 = entre le coefficient de rappel (k) dû 


Lamotte a obtenu pour 2 une estimation de l'ordre de l'unité (ce qui 
y (x) 


| à 
y(o) 
tre deux colonies distantes de x décroît très rapidement d'une valeur 
voisine de 1 à une valeur voisine de zéro quand la distance x passe de 
0,1 km (3) à 2 km). Mais les observations de Cain et Sheppard, sur 
l'augmentation de variance que peut provoquer la variabilité des coef- 
ficients de sélection d'un groupe à l'autre, paraissent empêcher d'éga- 
ler la variance expérimentale à la variance théorique y (0) qui résultent 
de (33'), et par suite d'estimer par cette voie le produit mh (comme 
l'avait fait Lamotte)(op. cit. ). 


traduit le fait que le coefficient de corrélation moyen ze. en- 


2/ Sil'onfaitintervenir, pour tenir compte de ces critiques, des 
taux u; et v; variant d'un groupe à l'autre C2 # 0), et si l'on suppose, 
pour simplifier, que ces taux restent constants au cours du temps dans 
chaque groupe (V, = V, = 0), la formule (33) permet, en ajustant l'ex- 
pression théorique de ARE Pe coefficients de corrélation déterminés 


y(o) 
expérimentalement par Lamotte, une estimation de 2 qui coïncide très 


sensiblement (la variation de l'exponentielle l'emportant beaucoup, 


(1) avec f=0, h=u+v, qd = C:le ler terme (l'unité) au dénominateur de (33'), 
y avait été négligé, ce qui n'est légitime que quand \ mh est grand % à 1/N. 


(2) Bulletin biologique de France et de Belgique, suppl. XXXV (1951) : h est noté 
k et mest noté, 


(3) L'évaluation pour x = 0,1 km résulte des données de Lamotte, qui avait ob- 
servé par petits groupes de 10 m de côté, les individus d'une colonie très 
vaste : celle de Coquerel qui s'étend sur près d'unhmecarré:il y a sensible- 
ment panmixie sur toute son étendue. 
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dans la zone utilisée, sur celle de la fonction linéaire) avec celle faite 
au 1/ ; h est encore de l'ordre de grandeur de m, 


Par contre, la formule (32) (avec V, = V, =0 et f = 0) peut four- 
nir sic£ est important, une valeur numérique (32'):y(o)= (1-q.)t2Nh 0? 


1+8N Ymh 


très supérieure à celle trouvée au 1/. Nous allons tenter de préciser 
l'influence possible de 0? (qui est la variance qu'aurait l'ensemble des 
valeurs d'équilibre locales en l'absence des migrations qui tendent à 
les égaliser) dans une région géographique telle que la portion d'Aqui- 
taine particulièrement étudiée par Lamotte (1). Les colonies bieniso- 
lées y ont un effectif moyen de l'ordre de N = 10°, et la variance de 
l'ensemble de leurs fréquences -variance qui est une estimation de y(o)- 
est de l'ordre de 1072. L'équation (32") donne en y prenant q (1- q,) = 0,2 
et h = m (données de Lamotte, arrondies) : 


1 
oo 8 Nh) = 0,2 +2 Nho’d'où: 


(34) Nh = 


Si, avec Lamotte, on prend o? = 0 et N = 10°, on trouve 
1 
400 
que p. 209 (2) ; mais, sio?est # 0, l'estimation fournie pour h par la 
formule (34) peut devenir considérablement plus grande : il suffit pour 
cela que 9? soit voisin de 0,04, donc o, voisin de 0,2, ce qui se produi- 
VA 
u; + vi 


RASEUEAVD) IE = 0,0025 : c'est, en ordre de grandeur, ce qu'il indi- 


rait si la variation d'une colonie à une autre du rapport C; = 


2 
pouvait atteindre l'ordre des : une telle variation, combinée avec des 


coefficients de rappel u: et vi très élevés, (donc une sélection à la fois 
très importante et très variable) serait tout aussi compatible avec les 
résultats numériques actuellement disponibles, que la sélection faible 
et non variable admise par Lamotte. La discrimination entre les deux 
théories ne sera possible que si l'on parvient à une détermination di- 
recte du taux de migration m, qui serait aussi, comme nous l'avons 
vu, une estimation de h. Mais nous regardons comme vraisemblable 
la théorie de Lamotte, qui considère o? comme négligeable (dans une 
région géographique suffisamment restreinte) car, dans le cas con- 


(1) Op. cit. chap. X. 


(2) I1 nous paraît difficile d'isoler, comme il l'a fait, p. 207, la mutation de la 
sélection. 
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traire, m et h auraient des valeurs numériques nettement plus grandes 
que celles qu'il donne, alors que le taux de migration entre colonies, 
de quelques millièmes, qu'il a obtenu, est déjà fort élevé par rapport 
au déplacement quadratique moyen (de 15 mètres par animal) qu'il 
avait observé à l'intérieur d'une colonie homogène (1). Nous sommes 
donc enclin à conclure comme lui, au rôle secondaire du phénomène de 
sélection sur le gène ‘'absence de bandes". Mais nous devons souligner 
à nouveau qu'une détermination directe de m apparaît comme indispen- 
sable pour trancher (2). 


La formule (34) nous montre encore que l'estimation de h et m 
devrait être augmentée si celle de N était diminuée, c'est-à-dire si 
l'on tenait compte des fluctuations d'effectif dans certaines colonies 
instables (fluctuations qui se traduisent, comme l'a montré Sewall 
Wright et comme le rappelle Lamotte, par la nécessité de diminuer 
l'évaluation de l'effectif ‘'efficace"'). Le peu de vraisemblance d'une 
valeur trop élevée de h et m conduit encore à admettre que, dans les 
colonies d'Aquitaine étudiées par Lamotte, les nombres d'individus 
sont assez stables pour que l'effectif efficace ne soit pas très inférieur 
à 107. (Pour l'étude de ‘l'effectif efficace!" et des problèmes que pose 
son évaluation, nous renvoyons à la suite du présent mémoire). 


3/ I1 est intéressant d'examiner aussi le cas particulier de (32) 
et (33) dans lequel o? serait nul sans que V, et V, le soient, c'est-à- 
dire le cas de variations aléatoires de u; et v, au cours dutempsdans 
chaque colonie -leurs moyennes étant toutefois les mêmes pour toutes 
les colonies. La loi de décroissance de la corrélation en fonction de la 
distance reste numériquement la même qu'au 1/, et l'estimation du 


h 
rapport M pour le gène ‘'absence de bandes!" chez les Cepaea d'Aqui- 


taine, reste voisine de 1. Mais y(o) est plus grand qu'au 1/, il est 
donné (si l'on suppose égales les variances V, et V, et si l'on fait 
1 S Our s 


(1) Remarquons incidemment que ceci nous oblige à admettre que les déplace- 
ments deviennent beaucoup plus importants pour les quelques individus qui 
ont, fortuitement, ou non, quitté une colonie, et que les probabilités, pour 
eux -ou pour leurs descendants- d'en atteindre une autre devient beaucoup 
plus grande, 


(2) Indiquons à ce propos que la détermination, entreprise par le Dr Sutter, de 
taux de migration dans les populations humaines permettrait, conjointement 
avec une étude de la variabilité génétique, des déterminations indirectes de 
taux de mutation et de sélection chez l'homme, par des méthodes analogues 
à celles qui ont été employées pour les Cepaea. 


| 
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US) A2 NV a Ie 2) 
Ho T+8N Vmh-4 NV, 
En faisant y(o) = 107? et N = 10° (avec de = 0,77) on trouve : 


Jmh = 0,0025 + 15 v, 


Si les coefficients u; et v; fluctuaient avec des écarts-types de l'ordre 
de 10 , V, serait de l'ordre de 107° et son influence sur les valeurs 
numériques de m et h serait négligeabie. Si les écarts-types de u; et 
v;, étaient, par contre, de l'ordre de 10°?, l'estimation à adopter pour 
m et h ne dépasserait pas le double de celle du 1/ et ne pourrait attein- 
dre 10 ?, ce qui est contradictoire, car les moyennes de u; et v;, et 
par suite h, doivent être au moins de l'ordre de grandeur des écarts- 
types. La présente hypothèse n'a donc aucune valeur explicative en ce 
qui concerne les Cepaea (au paragraphe E, dans le ‘modèle de Ki- 
mura'', nous avons déjà indiqué qu'iln'y a de modification importante que 
quand la variance du taux de sélection dépasse l'ordre de u ou celui de 
_ cehquimnespeutétremle cas ici) 

4/ Après ces quelques exemples, nous pouvons résumer le rôle 
des différents facteurs qui interviennent dans (32) et (33) en disant que 


le degré de différenciation à courte distance est caractérisé (1) par 


le rapport = qui figure dans l'exponentielle : la différenciation entre 


groupes voisins est accrue par les pressions "internes" qui s'exercent 
dans chacun, et diminuée par la migration entre eux, alors que le de- 


gré de différenciation à grande distance est: caractérisé par la variance 


y(o) (2) qui est diminuée (pour 2 fixé) par une augmentation de l'effec- 


tif N ou du taux de migration m, mais est par contre augmentée par 
une fluctuation (dans le temps, et surtout dans l'espace) des taux de 
mutationet de sélection (3). Nous avons ainsi pu compléter, par l'ana- 


(1) Pour une sen fixée de j - i = x, la moyenne arithmétique des différences 
de 0e" 0 =" (d) - 4)]’est 2 (y(o) - y(x),dont le rapport a la variance 
J l q; î 


h 
y(o) dépend essentiellement de me 


(2) Quand x est suffisamment grand, la moyenne des différences (q' = q!)°est 
égale à 2 y(o). 


(3) C'est pour cette raison que l'introduction de l'hypothèse de Sheppard, pour 
rendre compte de la variance observée par Lamotte, nécessiterait, pour 
compenser la fluctuation de ces taux, un coefficient de migration plus élevé 
encore que celui calculé par Lamotte. 
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lyse des incidences de la migration, les études fondamentales de R. A. 
Fisher et de Sewall Wright sur l'incidence conjointe de la mutation, de 
la sélection, et de l'effectif local (1). 


Remarque finale : 


Nous avons raisonné comme si les valeurs sélectives de gènes 
(A et a) occupant un même locus étaient indépendantes des gènes pré- 
sents dans les autres loci. Cela n'est admissible que dans une région 
géographique sur l'étendue de laquelle les fluctuations génétiques ne 
sont pas trop importantes. Par contre, si l'on considère deux régions 
suffisamment séparées pour qu'il s'y soit accumulé des stocks généti- 
questrès différents (par exemple l'Aquitaine et la Bretagne, en ce qui 
concerne les Cepaea), la valeur sélective d'un même gène peut être 
très différente d'une région à l'autre. Le système de gènes le mieux 
adapté à chaque région réalise un équilibre global, une ‘'homeostasie" 
(Lerner), un "pic adaptatif"' (S. Wright) qui peut différer d'une région 
à l'autre pour des raisons climatiques, écologiques, ou même fortui- 
tes. Mais nos connaissances insuffisantes sur les facteurs de l'adap- 
ÉD assez conjecturale une traduction mathématique pré- 
cise 
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(1) Indiquons encore que la formule (32) avec o < f & 1 entraîne la conséquence, 
souvent soulignée, que la pratique de croisements consanguins (en plus de 
ceux qui résulteraient de la panmixie) à l'intérieur du groupe local, équivaut 
à une réduction de son effectif dans un rapport qui ne peut être infé- 


1 
: Nes 
rieur à, 


(2) Voir toutefois S. Wright (Journal of Genetics, 1935, p. 257). 
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I - INTRODUCTION - 


Ilest bien connu que l'analyse classique de l'ajustement linéaire, 
lorsqu'elle est appliquée à des séries temporelles économiques, crée 
un grand nombre de problèmes difficiles. L'un d'eux est la corréla- 
tion des résidus dans le temps ; un deuxième, le problème des saisons 
lorsque sont utilisées des unités de temps inférieures à une année ; un 
troisième, lecaractère interdépendant et non contrôlé du développement 
de nos variables dans le temps, qui peut nous contraindre à adopterune 
approche par les équations simultanées ; un quatrième, l'effectif petit 
ou moyen de l'échantillon qui est à la base de nos calculs ; un cinquième, 
la présence d'erreurs d'observation ; un sixième, le fait gênant que le 
fondement économique de notre travail est d'ordinaire une micro-théo- 
rie, alors qu'en fait, nous avons besoin de macro-théories puisque 
nos variables sont habituellement des macro-variables. Or la difficulté 
principale n'est pas que cette liste de doléances puisse être allongée si 
facilement, mais le fait que la solution de l'un de ces problèmes est fré- 
quemment entravée par les autres. Par exemple, si nous avons affaire 
à un système d'équations simultanées, nous pouvons avoir le désir d'aug- 
menter l'effectif de notre échantillon, parce que l'analyse de l'estima- 
tion de tels systèmes est dans une large mesure une analyse asympto- 
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tique( 1), Mais si nous l'augmentons, disons en travaillant sur des ob- 
servations trimestrielles au lieu de nos observations annuelles, nous 
trouvons en face de nous : à 


1/ - un problème de saisons, 


2/ - une corrélation plus prononcée des perturbations succes- 
sives, et 


3/ - le fait que les organismes statistiques consacrent souvent 
moins d'efforts à la qualité des données trimestrielles qu'à celle des 
données annuelles. 


Ce qui vient d'être dit montre que si l'on essaye d'attaquer isolé- 
ment un problème particulier (par exemple le problème des équations 
simultanées dans l'hypothèse oùdiln'y a pas d'erreurs d'observation, où 
l'effectif de l'échantillonest suffisant, etc.), le résultat ne sera qu'une 
étape dans la direction visée. Cette remarque s'applique à la plupart 
des contributions récentes à la statistique économétrique ; et il n'est 
que juste de souligner qu'elle s'applique tout aussi bien à l'approche 
qui fait l'objet du présent article, à savoir le point de vue de la nature 
stochastique ou non stochastique des coefficients qui mesurent l'in- 
fluence des variations des variables explicatives dans une analyse 
d'ajustement. Cette question peut être introduite à l'aide de l'exemple 
suivant : 


Je Peu (CEE) 


où y. pour t = 1,...,T représente la variation(2) d'une variable dépen- 
dante quelconque pendant des périodes de temps successives, x. la va- 
riation correspondante d'une variable explicative, B un coefficient me- 
surant l'effet de cette dernière variation sur la première, et u, une pers 
turbation aléatoire. Le problème ordinaire consiste alors à estimer 
B sur la base d'un nombre donné (T) d'observations sur les deux va- 
riables. 


(1) Voir par exemple Theil [10, chapitre VI]. Récemment cependant, quelques 
essais couronnés de succès ont été effectués par À. L. Nagar [6,7] sur l'es- 
timation d'équations simultanées à partir d'échantillons finis. 


(2) La plupart du temps, x et y sont définis comme des niveaux atteints par des 
variables, et non comme des variations de variables. Bien entendu, cette 
interprétation n'a aucune incidence sur le plan mathématique ; nous l'adop- 
tons simplement parce qu'elle nous permet de formuler notre approche avec 
plus d'élégance. 
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Cette approche implique que les variations de la variable dépen- 
dante sont déterminées par deux forces distinctes. L'une de celles-ci 
est la perturbation aléatoire qui est supposée comprendre tous les fac- 
teurs qui affectent bien la variable dépendante maïs ne sont pas intro- 
duits sous une forme explicite ; l'autre est la variable dont les varia- 
tions sont indiquées par x, et qui est supposée influencer la variable 
dépendante en fonction d'un coefficient constant 6. Or il est facile de 
voir que cette hypothèse de constance a de fortes chances d'être res- 
trictive dans de nombreux cas. Supposons par exemple que x repré- 
sente les variations du revenu réel par tête et y les variations de la con- 
sommation réelle partête ; alors P (la propension marginale à consom- 
mer)mesure l'effet des variations du revenu sur les variations de la con- 
sommation dans l'hypothèse où cet effet est constant dans le temps. 
Mais on peut concevoir que cet effet ne soit pas constant et qu'il dé- 
pende de la question de savoir quels consommateurs voient leurs re- 
venus affectés. Par exemple, si une augmentation du revenu partête 
est imputable essentiellement à des accroissements des revenus des 
agriculteurs, nous devrions nous attendre à ce que l'effet soit moindre 
que dans le cas oùil serait dû à des augmentations des revenus destra- 
vailleurs manuels dans les villes. Bien qu'il ne semble pas impossible 
de réduire de telles divergences par quelque désagrégation, le phéno- 
mène en tant que tel ne va pas disparaître. 


Cesconsidérations conduisent à penser qu'il y a des circonstan- 
ces où il est préférable de remplacer (1. 1) par la spécification plus 
générale : 


M EM BEA (02) 


où best un coefficient aléatoire d'espérance B et de varianceo?, ces 
derniers paramètres étant indépendants de t. Sio?= 0, alors (1. 2) est 
équivalent à (1.1) ; ce qui montre que (1.2) est bien une spécification 
plus générale. En admettant que u, soit lui aussi aléatoire (avec espé- 
rance zéroet variance 92), nous voyons que dans cette approche, ilexiste 
deux forces aléatoires affectant les variations de la variable dépendante. 


Il y a quelques années, Hurwicz [3]et Rubin [8]-ont envisagé le 
problème de l'estimation d'équations du type (1. 2), surtout pour signa- 
ler les difficultés qu'il comportait. Le présent article traite de l'esti- 
mation de l'espérance des coefficients aléatoires, et également de l'es- 
timation des variances. Il concerne principalement le cas simple d'une 
seule variable explicative, étant donné que ce cas inclut toutes les par- 
ticularités essentielles ; la généralisationest directe comme on le mon- 
trera dans la section 5. Des applications sont données dans la section 6. 
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II - HYPOTHESES - 


Hypothèse 1 : 


Pour chaque t = 1,...,T, la variation y, de la variable dépen- 
dante est donnée par (1. 2) dans le cadre des spécifications des hypo- 


thèses 2, 3, 4 et 5. 


Les hypothèses 2 à 5 servent à éliminer l'influence perturbatrice 


d'autres complications (comme on l'a annoncé dans le second alinéa de … 


la section 1). L'hypothèse 2 précise que les x sont fixés, ce qui exclut 
la possibilité qu'ils constituent une variable conjointement dépendante 
dans un système dont (1.2) serait l'une des équations. Les hypothèses 
3 et 4 précisent que nos variables aléatoires ont des distributions nor- 
males, cependant que l'hypothèse 5 exclut le cas où elles auraient une 
corrélation entre elles. 


Hypothèse 2 : 


Pour chaque t = 1,..,,T, la variation x, de la variable indépen- 


dante est un nombre réel non stochastique. | Les-Tevaleurs:xS mx ne 
sont pas toutes égales. 


Hypothèse 21e 
Pour chaque t = 1,...,T, la perturbation additive u, a une dis- 


tribution normale de moyenne zéro et de variance Es indépendante de t. 


Hypothèse 4 : 


Pour chaquet = 1,...,T, le coefficient aléatoire b+ a une distri- 
bution normale d'espérance B et de variance cs indépendante de t. 


Hypothèse 5 : 


Les 2T perturbations additives et coefficients aléatoires sont in- 
dépendants entre eux. 


III - ESTIMATION DE L'ESPERANCE DES COEFFICIENTS ALEA- 
TOIRES - 


Une méthode très simple pour estimer B est celle des moindres 
carrés : 


_È X+ ÿt 


on 
DR Eu 


où > indique - iciet aussi bien plus loin - la sommation des T observa- 
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tions. Pour analyser plus commodément les propriétés de cet estima- 
teur, nous allons écrire (1.2) sous la forme : 


YnrP-xit us (3.2) 
où 


uorn FD) x (573) 


En combinant les hypothèses 3, 4 et 5, nous voyons aisément 
que u, a une distribution normale de moyenne zéro et de variance : 


NZ 2 PET 2 
Varu, 1677 SX, ; (3.4) 
et de plus que u’, u’,...,u? sont indépendants entre eux. 


En combinant (3. 1)et (3. 2), nous trouvons que b est un estimateur sans 
erreur systématique de B(1), 


Ex (px tu) 


Eb=E (3.5) 
> Ke 
et que son erreur d'échantillonnage est : 
> xd 
bb (3.6) 
Lx. 


En élevant au carré et en prenant la moyenne on a la variance : 


2x Var u: 1 
VAN enr re 0e LE pr rat 
(5x2) Re (2e) 


4 
Doc: 


(52) 


De même que dans le cas classique (02= 0), cette variance ne peut pas 
être déterminée exactement ; mais elle peut être estimée sans erreur 
systématique, parce que 0$ et of peuvent elles-mêmes être estimées 
sans erreur systématique. Onle montrera dans la section 4ci-dessous. 


La méthode des moindres carrés a l'avantage de la simplicité, 
mais elle n'est pas efficace. Le meilleur estimateur, linéaire sans er- 
reur systématique est obtenu par les moindres carrés pondérés, méthode 


(1) Ce résultat n'exige pas la condition que les coefficients aléatoires et les per- 
turbations suivent une loi normale. Une condition suffisante est que les x 
soient des valeurs certaines, que les coefficients aléatoires aient tous la 
même espérance B, et que les perturbations additives aient toutes une espé- 
rance nulle. 
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oùchaque observation est pondérée proportionnellement à l'inverse de 
la variance de ui. Ceci conduit à : 


» 2 
x x 
b! = D + Yt ÿ - - ( 8) 
2 2 y2 2 
af Foi x: Cr X} 
dont la variance est : 
2 1 
Dent 5 3.9) 
var b' = een : 
RES x® 


ce quiest inférieur à la variance des moindres carrés (3.7) sauf quand 
o2=0, auquel cas les deux méthodes d'estimation sont équivalentes. 
La méthode étudiée présente le désavantage évident que l'estimateur 
ponctuel ne peut être calculé que lorsque ge et CE sont connus. Le seul 
moyen (approximatif) de l'appliquer consiste par conséquent à calculer 
une estimation de B (par ex. le b des moindres carrés, à utiliser cette 
estimation dans le procédé qui sera exposé dans la section 4 pour obtenir 
des estimations de of et of , et ensuite à appliquer (3. 8) avec oê et cirem- 


placés par leurs estimations. 
IV - ESTIMATION DES VARIANCES - 


Alors qu'ilest possible dans le cadre de la spécification classique 
(1. 1) de trouver des estimations des perturbations ut, ce n'est plus le 
cas dans le cadre de la spécification présente : ni les perturbations 
additives u, de (1. 2), ni les déviations des coefficients aléatoires b; par 
rapport à leur espérance 6 ne peuvent être estimées séparément. Ceci 
ne signifie pourtant pas qu'il soit impossible de trouver des estima- 
tions des paramètres de leurs distributions. Nous avons déjà trouvé 
des estimateurs sans erreur systématique de l'espérance des coeffi- 
cients aléatoires, etil va s'avérer possible de trouver des estimateurs 
sans erreur systématique pour les variances d'une manière analogue. 


En considérant la perturbation ‘'combinée'' u, définie dans (3.3), 
nous observons d'abordque cette perturbation peut être estimée à par- 
tir des données dont nous disposons (comme égale à y, - b x.) ;'entses 
cond lieu, que la variance de cette perturbation est une fonction de la 
variation de la variable explicative qui contient les paramètres incon- 
nus 2 eto?, cf. (3.4). Ceci conduit à penser que nous devrions envi- 
sager le résidu des moindres carrés, 


Ves = Pa DRE, Mb (4. 1) 


. . Li 
et prendre son carré comme estimateur de la variance de u,. Ontrouve 
facilement que l'espérance de ce carré est : 


| 
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2 y 
X+ X > 
Ev? =05 h- ce jee nn (4.2) 
2x SE (x) 


Vtrro P+o7 QE, , (4.3) 
où 

x4 
Pals : (4.4) 

D D.< 

N “IE à 
ax li 2 A ; (4.5) 
2 IC). 


et w, est une variable aléatoire de moyenne zéro pour tous les t : 
Ew; = 0 (4.6) 


Nous appellerons (4.3) l'ajustement du résidu correspondant à la spé- 
cification (1.2). Ceci fait apparaître le carré de chaque résidu des 
moindres carrés comme fonction linéaire de deux fonctions connues 
des x, mis à part un terme additif (w.) qui est la perturbation de l'ajus- 
tement du résidu. Etant donné que les x et par conséquent les P et les 
Q sont des valeurs certaines et que de plus les perturbations w, ont pour 
moyenne zéro, l'application des moindres carrés à l'ajustement du ré- 
sidu donne des estimations sans erreur systématique de Ge et ce qui 
sont précisément les paramètres qui nous intéressent. Cependant, les 
moindres carrés ne sont pas nécessairement efficaces, puisque les w 
peuvent avoir une matrice de covariance qui diffère du type scalaire. 


En fait, nous avons : 
2 
var w, = E(v?- Ev?)? = Ev+ - (Ev£) = 2(Ev?) = 2(02P,+0? QŸ (4.7) 


en tirant parti de l'existence d'une loi normale de v, [v, est une fonc- 
tion linéaire de variances normales d'après (4.1)], et du fait que le 
quatrième moment centré d'une variable normale est égal à trois fois 
le carré de la variance(l), De la même façon, nous trouvons pour la 
covariance de w, et w,,(t #t'): 


cov (W,, W,r) = E [(v? - Evé)(vé - Evi)] = 


Eve) Ever de 2 Er) 


2 472 4 2 
XEX}: Ex 
De_— ” -0? 22 005(48) 
2 2 
(z x°Ÿ Dix 


(1) Voir par exemple Kendall {4,p. 80]. 
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où on tire parti de ce quel), si X et Y suivent une loi normale liée à 
moyennes nulles (comme v, et v.),onaE(X° Y°) EX? EY/+2 [E(XY)J. 
On voit immédiatement que la covariance est de l'ordre de 1/T25%et 
par conséquent, puisque les variances sont de l'ordre de 1 d'après (4.7), 
que les perturbations de l'ajustement du résidu sont liées par une cor- 
rélation de l'ordre de 1/T° seulement. Pour prendre un exemple, si 
nous considérons le cas où toutes les valeurs x sont égales(2), la cor- 
rélation d'un couple quelconque (w., w..) est égale à 1/(T-1)°, ce qui 
est une quantité tout-à-fait infime pour presque n'importe quel effec- 
tif d'échantillon réaliste. Nous allons donc négliger ces corrélations. 


Le procédé d'estimation proposé pour 0fet o? consiste donc à ap- 
pliquer d'abord les moindres carrés ordinaires à (4.3), ce quiconduit 
aux premières estimations si et s° : 

2 = F2 2 2 
À NE Pe = EE Le 5 s AE Q, 
(4.9) 
2 = 2 2 É2 . 
2 EE 2F,Q rar à 


puis on se sert de ces estimations pour appliquer les moindres carrés 
conformément à l'expression de la variance (4. 7) : 


2 ? 
4 Vt+ F, 2 \ P+ 2 P Q 
D D 
(5, PF, +5: Q,) (S P.+s1 Q.) (So R +s; Q@:) 
z ae (440) 
S V Q Ps 12 Q 2 Q 
D 2 . 2 So 2 2 : | 2 Sd D Er —- 
(ss P +s: Q)) (So P. +s:Q,) (So PF. +5, Q;) 


2 2 : : 
s' et s' étant les moyennes estimations de of et de 0? respectivement. 
La matrice de covariance est : 


G) -1l 
N P, Ÿ P, Q: 
s! End 2 LS RTE RE PC ETS 
0 (ss P, à siQ) (ss F, “5 s’ Q,)° 
V à 2 (4. 11) 
2 . 
aie SRE Ne 
Li 
(eS Phet Qu} ay (arts 0) 


(1) Voir par exemple Kendall [4, p. 80]. 


(2) Le cas spécial où les x sont égaux a été exclu dans l'hypothèse 2, aussi cet 
exemplen'a-t-il qu'une valeurillustrative. On voit facilement que ce cas doit 
être rejeté, car sinon P, et Q, seraient constants (c'est-à-dire indépendants 
de t), si bien qu'il serait impossible d'estimer 0° eto?, 
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Le signe £ est employé pour indiquer que la matrice de covariance n'est 
égale qu'approximativement à la matrice de droite. L'égalité serait 
exacte si si et s° étaient remplacées par leurs valeurs vraies, dans 
(4. 10) et dans (4. 11). 


Il y a lieu de faire trois remarques supplémentaires. D'abord, 
bien que les moindres carrés généralisés appliqués à (4.3) donnent les 
meilleures estimations linéaires(l) sans erreur systématique deof et 
o? si on veut apprécier leur signification, on est gêné par le fait que 
l'emploi traditionnel des écarts-types tels qu'on les obtient à partir de 
(4. 11) n'est pas parfaitement satisfaisant, La raison en est que la va- 
riable dépendante de la régression du résidu est non-négative, en sorte 
qu'elle ne peut pas être distribuée suivant une loi normale, et la même 
remarque s'applique aux estimations de o?et 0?; par conséquent, il 
n'est pas entièrement correct de dire que l'estimation ponctuelle s° plus 
ou moins deux fois (par exemple) l'écart-type, contient cé avec une pro- 
babilité obtenue à partir d'une loi de Student. Le deuxième point est 
que l'ajustement du résidu se caractérise par une dispersion considé- 
rable, ce qui implique qu'un assez grand nombre d'observations est en 
général nécessaire pour estimer avec précision 05 et o?. Pour bien voir 
ceci, considérons l'équation v? = Ev? + w, ; après avoir élevé au carré 
à gauche et à droite, pris l'espérance mathématique, et pris la moyenne 
dans le temps, nous obtenons : 


1 1 il 

T 5+ Ev* . PEROU :,Ew. (4. 12) 
En comparant les deux termes de droite et en appliquant (4.7), 

nous trouvons que le second terme est égal au double du premier. Par 


conséquent R - 5 pour l'ajustement du résidu, R étant la corrélation 


multiple vraie de cet ajustement(2), On peut se servir de ceci comme 
test de la suffisance des hypothèses de base ; mais on n'entrera pas ici 
dans cette voie. Le troisième point enfin est étroitement lié au second : 
l'écart-type de la perturbation de l'ajustement du résidu est propor- 
tionnel à l'espérance de sa variate de gauche, le facteur de propor- 
tionnalité étant V2. Il est intéressant de noter que ce type d'hétéros- 


(1) linéaires par rapport aux carrés des résidus vi. 


(2) Onnotera que R est fondé sur des moments ordinaires, non pas sur des mo- 
ments centrés. Par conséquent 1 - R°(=2/3) est le rapport du second moment 
des perturbations de l'ajustement des résidus [= le deuxième terme dans le 
membre de droite de (4. 12) Jau second moment des cârrés des résidus [= le 
terme situé à gauche dans (4. 12) ]. Le second moment des perturbations est 
évidemment identique à la variance, mais celui des ve ne l'est pas. 
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cédasticité s'applique aussi à certaines données sur les ménages, (1) 
l'écart-type de l'erreuraléatoire par rapport à la courbe d'Engel étant 
ici proportionnel à l'ordonnée correspondante de la courbe. Dans ce 
cas, la constante de proportionnalité n'a pas nécessairement la valeur 
V2 bien entendu. 


V - SIMPLIFICATIONS ET GENERALISATIONS - 


On notera que la différence entre P, et 1 et celle entre Q, et x a | 


sont l'une et l'autre de l'ordre de 1/T[cf.(4. 4) et (4.5) ].En consé- 
quence, si nous sommes disposés à commettre une erreur de cet or- 
dre de grandeur, nous pouvons simplifier (4.3) pour avoir : 

vi soi + ox? + w! (5.1) 


où w! a une espérance de l'ordre de 1/T. Comme la différence entre 


w, et w! est de l'ordre de 1/T, et comme en outre w: a une variance de : | 


l'ordre de 1, on voit aisément que la variance de w! à la même valeur 
compte non tenu des termes d'ordre de grandeur en T inférieur. Nous 
avons donc le droit d'écrire : 


var w! 2 (o2+ o2x°) , (022) 


parce qu'au niveau d'approximation où nous nous trouvons, PF, = 1 et 
Q,  x?. De même on peut montrer que les w; sont liés par une corré- 
lation de l'ordre de 1/T°? seulement. 


Cette simplification, qui suppose essentiellement que nous con- 
sidérions v, comme une approximation asymptotique de ue peut être 
permise quand l'effectif de l'échantillon est véritablement suffisant . 
Elle revêt une importance toute spéciale quand le nombre de variables 
explicatives n'est plus 1, comme nous l'admettons jusqu'à présent, 
mais davantage, disons 2. Dans ce cas, nous devons remplacer (1.2) 
par : 


Y, Dex, TD TU (5.3) 


oùx,, et x,. Sont les variations de deux variables explicatives différen- 
tes. Nous étendrons à ce cas les hypothèses de la section 2 de façon 
que l'une et l'autre variables explicatives prennent des valeurs cer- 
taines, que u,, b.,, b,, suivent une loi normale avec les moyennes O, 
B,,B, et les variances 5, 0e, ne respectivement, et que les 3T coeffi- 
cients aléatoires et perturbations additives soient indépendants entre 
eux. Nous pouvons alors écrire (5.3) sous la forme équivalente : 


(1) cf. Theil [9] et Fisher [1]. 
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Ye — Pi XI PB xt un (5. 4) 


où la perturbation combinée : 


* 
DR EUD Pie (br Bb) x; (5.5) 
a une espérance nulle et la variance : 
* 2 2 2 2 2 
Var U+= 09 + O1 Xjt + O2 Xot. (5.6) 


Après avoir estimé , et B, par les moindres carrés, nous obtenons les 
| résidus des moindres carrés v,. En appliquant l'argument de l'alinéa 
précédent, nous pouvons alors établir l'ajustement du résidu : 
2 2 2 2 2 2 
ME CORPS io KW, (5.7) 
| où w} est une perturbation dont l'espérance est de l'ordre de 1/T et la 
variance : 


De A2 


Se 2 QE 2 2 
var Wi # 2(05 CR PRE ES CU 


(5.8) 

si on néglige les termes d'ordre élevé. La méthode à suivre exposée 
pour le cas d'une seule variable est donc facilement généralisée, et 
l'extension au cas de trois variables ou plus est directe. 


Ilest également assez facile de généraliser les hypothèses 3 à 5 
de façon que les T couples (u+, b:) deviennent des tirages au hasard 
indépendants effectués dans une population-mère normale à deux dimen- 
sions de moyennes (0, B), de variances (06, o°) et de covariance ©: #0. 
Ce cas offre la possibilité d'une corrélation du décalage additif et du 
décalage multiplicatif, soit positive, soit négative. Il nous faut alors 
remplacer (4.2) par : 


x2 <e Se 
SU oo x, De 2 ++, . 
t 0 01 t 
2x É20e 


ce qui peut être simplifié pour donner : 


Evo taux. T six (5210) 


1 


si nous sommes disposés à négliger les termes de l'ordre de 1/T. De 
même si nous avons deux variables explicatives(cf. l'alinéa précédent), 
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et si les T ensembles de trois variates (u,, b,,, b,,) sont des tirages 
indépendants au hasard effectués dans une population-mère normale à 
trois dimensions de moyennes (0, B,, B,) et avec une matrice de cova- 
rlances: 


Cr) Son To2 
2 « 
© À f 
gi GE: 12 (5. 13) | 
2 11 
© [oj (o} | 
02 12 2 | 


alors l'espérance du carré du résidu des moindres carrés est de l'or- 
dre-detifT © | 


2 2 2 2 DO 
Eviro,+oixisto xt 2(o.x., + 0:x:#0x: x") (5. 12) 


ce qui est une forme quadritique qui s'obtient avec (5. 11) comme ma- 
trice et (lis x: x 4). comme-vecteur, 


VI APE RICAMIONSS 


Nous avons appliqué le procédé proposé dans les sections 3 et à 
aux données sur les prix d'importation et d'exportation du Royaume- 
Uni pendant la période 1879-1952. La théorie (simple, on l'admet) est 
que la variation annuelle en pourcentage de l'indice des prix d'expor- 
tation (y) dépend de la variation en pourcentage de l'indice des prix 
d'importation (x) pour lamême année selon (1.2). L'effectif de l'échan- 
tillon est T = 65, les années de guerre étant exclues(1), 


L'estimation de B par les moindres carrés (la première étape) 
est : 


b = 0,795 (6.1) 


Les moindres carrés appliqués à l'ajustement du résidu (deuxième 
étape) (2) donnent Ê | 


Sos et s,= 0,044 (622) 


(1) Les données de base, qui ont été prises dans Kindleberger [5, pp. 22-25] con- 
cernent les importations et les exportations de marchandises ; elles ont été 
reproduites dans l'Appendice (Tableau 1). 


(2) Le carré de la corrélation multiple correspondant à cette spécification de la 
régression du résidu est R° = 0,371. En appliquant la valeur vraie de R° = 173 
de notre hypothèse nulle, il n'y a aucune possibilité de rejet.Ainsi l'écart-type 
tel qu'il est donné par Kendall{4, p.385, eq. (15. 64)] a la valeur 0,095, On 
notera, bien entendu, qu'une telle appréciation de la signification est contra- 
riée à la fois par l'absence de loi normale et par l'hétéroscédastivité. 
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HEn appliquant les moindres carrés pondérés à l'ajustement du résidu 
ÿ (troisième étape), nous trouvons : 


S° = 0,4 et SNE0, 075 (6.3) 


les écarts-types étant alors d'après (4. 1i} respectivement 2,4 et 0,033. 
à Enutilisant les critères traditionnels, nous dirons que les deux valeurs 
© (6. 3) sont positives dans une mesure significative. Enfin, l'estimateur 
: de B par les moindres carrés pondérés fondé sur les estimations ponc- 
2 tuelles (6.3) est : 


b' = 0,855 (6.4) 


ÿ avecunécart-type de 0,078. L'écart-type de la première estimation b, 
} également fondée sur (6.3) est 0,098. En nous en tenant aux estima- 
! tions ponctuelles, nous pouvons conclure que la variation en pourcen- 
l tage du niveau des prix d'exportation est soumise à une perturbation 
} additive qui suit une loi de moyenne zéro et d'écart-type 3. 1, et qu'elle 
est affectée par la variation en pourcentage du niveau des prix d'im- 
} portation en fonction d'un coefficient aléatoire d'espérance 0.85 et 
mécart-type 0,27. 


On a déjà souligné le fait qu'un assez grand nombre d'observa- 
tions est en général nécessaire pour réaliser avec succès cette appro- 
che. Ceci s'applique bien entendu en particulier lorsqu'il y a plusieurs 
variables explicatives. L'exemple suivant est illustratif à cet égard ; 
il concerne la consommation réelle par tête aux Etats-Unis, qui est 
exprimée linéairement en fonction du revenu réel par tête courant et 
du revenu réel par tête le plus élevé atteint dans le passé(l). La rela- 
tion a pour base des données annuelles pour la période 1897-1949, les 
années de guerre exclues ; l'effectif de l'échantillon est T = 44. En 
| appliquant les moindres carrés à (5.3) (x, et x, étant interprétés res- 
pectivement comme les variations du revenu courant et du revenu le 
plus élevé atteint dans le passé, nous obtenons : 


DER 0 531 et b;500,228 (6.5) 


1) Le revenu a été défini comme le revenu personnel disponible, d'après les 
données de Goldsmith [2, Vol. III, p. 429 ];la consommation est obtenue en 
soustrayant l'épargne personnelle totale [2, Vol.I, p. 370] l'une et l'autre sé- 
ries ont été divisées par la population totale résidant aux Etats-Unis d'après 
les Statistical Abstracts. Les deux séries ainsi obtenues sont reproduites 
dans l'Appendice (tableau 2). 
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L'ajustement du résidu est alors appliqué sous sa forme simpli- 
fiée (5. 7)et les estimations ponctuelles par les moindres carrés sont \ 


de 462 s? = - 0,065 s2= 0,119 (6.6) 


So Aus mesuré en dollars de 1929. Il est clair que la valeur négative 
de s'est mauvaise et que la valeur positive de s° est d'une grandeur. 
peu vraisemblable: Cet exemple montre aussi ‘il vaut la peine de 
commencer par mettre en œuvre l'ajustement du résidu sous sa forme » 
simplifiée, car la forme complète nécessite beaucoup plus de travail. 
de la part du calculateur. 
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APPENDICE 


Tableau 1 : Indices de la valeur unitaire des importations (P,) et des 
exportations (P,) de marchandises pour le Royaume-Uni 
1870-1952 (1913 = 100) 


Années EE? FE, Années Px Pr 
1870 120 104 1905 86 84 
1871 115 104 1906 90 89 
1872 123 11 34 1907 94 94 
1873 123 121 1908 90 91 
1874 120 113 1909 92 88 
1375 116 196 1910 99 92 
1876 113 98 1911 97 94 
1877 113 93 1912 98 96 
1878 106 89 LOS 100 100 
1879 102 85 
1880 107 88 1920 214 270 
1881 106 85 1921 151 213 
1882 105 85 1922 138 182 
1883 103 84 1923 140 180 
1884 98 81 1924 141 173 
1885 92 ul 1925 154 183 
1886 86 74 1926 142 107 
1887 85 73 1927 136 165 
1888 88 75 1928 157 162 
1889 89 78 1929 134 159 
1890 88 82 1930 17 151 
1891 89 82 1931 88 126 
1892 86 78 1932 64 91 
1893 85 tin 1933 74 110 
1894 78 74 1934 93 132 
1895 75 72 1935 93 130 
1896 tt 73 1936 98 135 
1897 vu 72 1937 Pl 145 
1898 ti 72 1938 103 147 
1899 79 77 
1900 85 89 1948 245 296 
1901 82 85 1949 229 283 
1902 82 81 1950 194 221 
1903 84 82 11S5 258 260 


1904 85 83 1962 252 273 


CONCEPTION STOCHASTIQUE DE CŒFFICIENTS MULTIPLICATEURS 297 


Tableau 2 : Revenu réel disponible par tête (Y) et consommation (C) 
pour les Etats-Unis 1897-1949 (en dollars de 1929). 


Années NT @ Années Mi C 
1897 SGH 2 350.0 1923 594. 1 507 
1898 369. 3 32001 1924 596. 5 EAils7l 
1899 388.0 321120 1925 59h20 504, 0 
1900 3067 0072 1926 622.4 539. 0 
1901 430.7 3956 1927 629.9 1453 
1902 426.6 5pS.0 1928 619.3 569.9 
1903 436.9 401. 1 1929 670. 5 5762 
1904 434.8 A ONE 1930 GHIGES 569. 0 
1905 449.9 370.6 1931 580.9 558. 1 
1906 495, 5 427.8 1932 491.3 5249 
1907 566. 6 465. 7 1933 478. 8 519.2 
1908 454,3 413. 4 1934 513219) 5295 
1909 524. 9 465. 7 1935 561.6 HS, 8 
1910 499,5 440. 0 1936 631.7 5879 
1911 488. 8 451.6 1937 644,9 579.9 
1912 488. 4 418.9 1938 600.0 HS. 7 
1913 496. 1 As 2 1939 GAS 579.9 
1914 AGSPNE 423.0 1940 67841 601.6 
1915 496. 9 220, 2 1941 711952 668. 0 
1916 D 20 4518 

1946 879.5 15289 
1919 602.0 D'INTRCS 1947 823.6 11225 7 
1920 539. 4 490, 1 1948 83540 SE 
1921 500. 1 488. 8 1949 822.9 72149 
1922 DATE ATOM 
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FONCTIONS DE RÉPARTITION 
A N DIMENSIONS ET LEURS MARGES 


M. SKLAR 


M.M. Fréchet (1) a étudié le problème de la détermination des 
fonctions de répartition à n dimensions dont les marges sont données. 
En ce qui suit nous considérons ce problème d'un point de vue nouveau. 


Pour les définitions des fonctions de répartition, des marges, 
etc., voir p.67 dans le premier ouvrage cité en (1). Les définitions 
qu'on y trouve sont exprimées pour n= 2, mais elles peuvent être éten- 
dues à n quelconque. 


THEOREME 1 - 


Soit G,\ une fonction de répartition à n dimensions avec les mar- 
PeSE. >, ..-, Er. SOI À; L'ensemble des Valeurside F\ pour 
k=1, 2,..., n. Alors il existe une fonction unique H,, dont l'ensem- 
ble de définition est le produit Cartésien R,*XR,x*x ... xR, et telle que : 


ES (X:, COLE TEE Xn) = H, Œ (x), 1 (x), CPC D Cp F, (X)). 


Définition 1 : 


Nous appellerons copule (à n dimensions) toute fonction C, conti- 
nue et non-décroissante (2) définie sur le produit Cartésien de n inter- 
valles fermés [0,1] et satisfaisant aux conditions : 


(1) M. Fréchet : sur les tableaux de corrélation dont les marges sont données, 
Ann. Univ. Lyon, Sect. A(3), 14, 1951, 53-77. Voir aussi M. Fréchet, 
Comptes Rendus Acad. Sci., Paris, 242, 1956, 2426-2 428; E.J. Gumbel, 
Ibid., 246, 1958, 2712-2719 ; R. Féron, Publ. Inst. Statistique Univ. Paris, 
5,21956, 6-12; 

(2) Non-décroissante'' au sens employé pour une fonction de répartition à n di- 
mensions. 
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(6, 0; 4545 0) = 0 IC DEN RS EEE 
THEOREME 2 - 


La fonction H, de Théorème 1 peut être prolongée (en général de 
plusieurs façons) à une copule C,. Etant un prolongement de H,, la 
copule C, satisfait à la condition : 


Gris 2) Core), PC eee, F, (x1)) 
THEOREME 3 - 


Soient données des fonctions de répartition F,, F,, ..., F, à une 
dimension. Soit C, une copule quelconque à n dimensions. Alors la 
fonction G, définie par : 


G,(x CHLEOEN X) 5 CE (x), F; (x), * 2Ner F; (X)) 


est une fonction de répartition à n dimensions avec les marges 
MR Er ds ne 


n 


Les Théorèmes 1-3 réduisent le problème mentionné de 
M. Fréchet au problème de la caractérisation des couples à n dimensions. 
Il n'y a qu'une seule copule à une dimension, notamment P,, qui satis- 
fait la condition P,(x) = x pour tout x entre 0 et 1. Pour n >1,ilya 
une infinité de copules de dimension n, limitées par deux fonctions 
particulières. 


THEOREME 4 - 
Une copule quelconque C, à n dimensions satisfait aux inégalités : 


L, < Ce UE 
où : 
Aloe CE ca) = Max (ao, + a, + RE HO -n + 1,0) 


M,(ax Xo; a) = Min,(«;, X2s an ). 
Pour n >1, les fonctions P,, définies par : 
FF (aisance a enfer (Of SE M2, 7° n) 


sont des copules à n dimensions. Elles déterminent le tableau de cor- 
rélation de n variables aléatoires indépendantes, 


(1) Des cas spéciaux de telles fonctions ont été considérés par M. Féron, op. cit. 
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Or, les copules sont en général d'une structure plus simple que 
les fonctions de répartition. On peut utiliser cette simplicité en intro- 
duisant la notion du ‘'quasi-inverse'' d'une fonction monotone. 


Soit f une fonction monotone d'une variable réelle, Ajoutons à 
l'ensemble des points (x, f(x)) tous les segments fermés de la forme 
[(x, f(x+)), (x, f(x-))]. Réfléchissons l'ensemble résultant dans la li- 
gne y = x. Enlevons de l'ensemble réfléchi tous les segments verticaux 
à l'exception d'un seul point sur chacun d'eux. Tout ensemble qu'on 
peut obtenir de cette façon représente une fonction, que nous nomme- 
rons une quasi-inverse de la fonction f (1). 


Selon cette définition, chaque fonction de répartition F à une di- 
mension possède au moins un quasi-inverse F° défini et non-décroissant 
sur l'intervalle fermé [0,1] et prenant des valeurs finies sur l'inter- 
valle ouvert (0,1). Parmi ces quasi-inverses, ilyenaunquiest continu 
à gauche sur (0,1) et continu à 0 et à 1. 


THEOREME 5-- 
Soit Q, une fonction de n variables, intégrable dans l'espace 


euclidien E° à n dimensions par rapport à une fonction de répartition G, 
à n dimensions. Soit C, une copule telle que l'on ait : 


G, (k, x3 ..., X,) = CF (mi), F,(%), ..., EF, (x) 
OÙ RE... EF sont les marges.de G. "Alors": 
(1) For QUE EUR, OX JNEIGOICEUEXE EEE) 
En 


& *: Aer (x), 7 (a), ..., F, («,)) d Ces Xp vs cn) 
ap ; 


où U” est le produit Cartésien de n intervalles [0,1]. 


L'expression au côté droit de la formule (1) peut être plus simple 
que celle au côté gauche. C'est le cas, par exemple, si C, est absolu- 


ment continue, comme au cas C,=P, ;oun=2etC, = L,ou M,; ou 
sin=3etC,=M;. 


(1) Des formes diverses de telles fonctions quasi-inverses ont été considérées 
par plusieurs auteurs. 
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UN MODÈLE ÉCONOMÉTRIQUE 


LA PROJECTION A LONG TERME 
DE VERDOORN 


P. THIONET 


1/- M. Verdoorn a dit dans un article assez récent d'Economé- 
trica (1) comment le Bureau Central de Planification de La Haye s'y 
était pris pour effectuer une projection à long terme du revenu national 
des Pays-Bas ; cette projection s'étend de 1950 à 1970 ; mais les der- 
niers résultats des calculs n'ont été publiés qu'en 1955 de sorte qu'il 
s'agit plutôt d'une projection à 15 ans qu'à 20 ans de distance. La mé- 
thode de Verdoorn semble avoir été décrite dans un travail en hollandais 
publié dès 1952. Le ‘modèle de Verdoorn" a fait l'objet en 1958-59 de 
discussions dans des réunions internationales. 


On discutera ici exclusivement l'article paru dans Econometrica, 
lequel doit représenter l'aspect le plus élaboré de conceptions suscep- 
tibles d'une évolution notable. Ilne s'agit manifestement pas d'une œu- 
vre mûrie dans l'abstrait mais d'un travail qui s'est imposé par les 
besoins de la planification et qui ne se soucie guère d'esthétique ma- 
thématique. 


2/- Son point de départ présente de sérieuses ressemblances 
avecles conceptions ‘'globales"”" de nombreux économistes (français ou 
non) : on se donne comme but de déterminer le revenu national global 
en 1970. 


Là-dessus se greffe bien une opération ‘'Input-Output" ; c'est-à- 
dire que, l'économie étant supposée ventilée (disons) en onze branches 
(2) on calcule lestaux d'expansion (1970/1950) auxquels chacune de ces 


(1) P.J. Verdoorn - Complementarity and longrange projections Econometrica 
Oct. 1956, p.429 à 450. 

(2) Métaux, Chimie, Textiles et habillement, Alimentation, Services Publics, 
Mines, Bâtiment et Travaux Publics, Autres industries, Agriculture, Trans- 
ports, Autres services. 


234 P. THIONET 


branches arrive ; mais cen'est pas du tout le Tableau d'échanges indus- 
triels qui a permis de dire que ces taux sont atteints en 1970, plutôt 
disons qu'en 1980. 


3/- Nous allons donc étudier un modèle très global ; mais ce n'est 
pas en fait un vice :les Pays-Bas ne sont pas du tout en mesure de vivre 
en quasi autarcie (1). 


Dès lors il est secondaire de se donner ou non des objectifs de 
consommation de chaque type de produits en 1970. L'essentiel est de 
produire des articles exportables ; et ce n'est justement pas là qu'on 
peut raffiner beaucoup le modèle. 


Brefla planification ne demande pas du tout à être traitée par les 
mêmes moyens aux Pays-Bas, en France ou en U.R.S.S. 


4/- Entrons plus avant dans l'étude du modèle (2). Pour Tinbergen, 
les équations du ler degré étaient susceptibles de remplacer en pre- 
mière approximation à peu près toute autre équation, mais ce qui est 
bon pour des problèmes de statique ne vaut plus lorsqu'on étudie des 
évolutions portant sur 20 ans. 


Ainsi Verdoorn a conservé partout les fonctions puissances et les 
exponentielles sans les ‘linéariser'"'. Mais bien des relations (les iden- 
tités comptables surtout) restent des relations linéaires ; ces deux 
types de relations combinés ne peuvent rien donner de simple. 


En particulier et commeune sorte de seconde approximation, les 
courbes d'équation mal connue sont remplacées partout par des courbes 
à élasticité constante. Or la plupart du temps, on devra ajouter ou re- 
trancher entre elles ces fonctions à exposants disparates. 


(1) Voici l'importance relative de la production et des importations dans les 


Pays-Bas et en France. 
Production De sage 
non agricoles 


(Milliards de dollars) 


Pays-Bas 3, 155 
France 1274 19 


(2) Celui-ci est reproduit en annexe. 


(Vers 1952-1955) 
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Il n'est donc pas surprenant que le modèle de Verdoorn, basé sur 
17 relationstrès simples (beaucoup trop simples, même) entre 19 va- 
riables aboutisse à des équations résolvantes (après élimination des 
variables intermédiaires) d'aspect peu engageant. 


Analysons à présent les 3 parties du modèle : Capital, Travail, 
Balance extérieure. 


5/- Le Capital : Sa loi de formation. 


La partie du modèle concernant le Capital est assez subtile. 


- une fraction déterminée du revenu national constitue l'é- 
pargne (dont une partie ad libitum peut être exportée suivant les besoins 
en devises ; le reste est investi). 


- une fraction constante (1 - w) dela dépréciation de l'équi- 
pement existant (20 % dans l'application numérique du modèle) vient 
s'ajouter à l'équipement neuf (qu'on appelle équipement ‘'net'') et re- 
présente le matériel amorti mais encore capable de servir. 


Mais la seconde de ces fractions serait une vraie constante, alors 
que la première serait une variable instrument entre les mains des 
pouvoirs publics (on l'intitule à cet effet : propension à épargner). 


Pour mieux comprendre le modèle du Capital nous allons imaginer 
que le pays vit en économie fermée et regarder ce que cela implique. 


Le modèle comporte les deux concepts de Produit National Brut 


(PNB) v et de Revenu National y, qui diffèrent par une quantité d ap- 
pelée la Dépréciation (1) : 


On écrit donc : 
Investissements nets : i=axy 
Investissements de Remplacement : i'=wd; d-i'=(1-w)d 


Si k est le stock de capital et k la dérivée de k par rapport au 
temps, on écrit : 


(1) "Depreciation'" en anglais. 
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Formation d'équipements : 


k=i+d-i 
= a(v - d) + d(i - w) 
ou : k-av=(1-w-a)d 


Ici il faut marquer un temps d'arrêt. 


Avecle modèle Keynesien ‘'naïf'', où la dépréciation et les rem- 
placements sont supposés identiques l'un à l'autre, on écrit couramment : 


k-av=0 


Verdoorn remplace au 2ème membre zéro par un terme non iden- 
tiquement nul, mais qui en fait est petit. 


La valeur numérique du paramètre w finalement retenue par Ver- 
doornest 0,80, donc 1 - w = 0,20. Ainsi (1 - w - &) est assez petit, car 
la propension à épargner aest assez voisine de 20 %. 


Par rapport au modèle naïf, le modèle de Verdoorn apporte un 
certain freinage à la constitution d'équipements lorsque «a devient trop 
fort supérieur à (1 - w) et au contraire pousse à accroitre le stock d'é- 
quipements lorsque «est trop faible, inférieur à (1 - w). 


6/- La demande d'équipements. 


Tout modèle oppose la demande à l'offre ; et ce qu'on vient d'écrire 
est l'équation de l'offre. La demande d'équipements est imprimée par 
l'expansion du F.N.B.; le phénomène physique est celui des goulots 
d'étranglement ; mais c'est la psychose de l'entrepreneur qui détermine 
les commandes d'équipements neufs, etiln'est pas absurde d'assimiler 
celui-ci àun consommateur d'équipements, et de supposer une certaine 
permanence à l'élasticité de la demande d'équipement ; soit y cette 
élasticité qu'on choisit d'ailleurs ici égale à 80 %. 


Sile P.N.B. estentrain d'augmenter disons de 5 % l'an, le stock 
d'équipements tendra à augmenter de 4 % l'an. 


(Ce qui surprend, c'est que la production puisse toujours physi- 
quement augmenter ainsi de 5 %). 


Ilnous manque une équation : celle qui fixe l'importance des dé- 
préciations. Là encore on admet qu'une loi psychologique nous condamne 
à une élasticité constante, et on prend cette fois l'élasticité (V) égale à 
120 % (par rapport au stock de capital). 
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On observera que l'élasticité des dépréciations (d) par rapport 
au P.N.B. est de ce fait : 


1.20 x 0,8 = 0.96 ou 96 % 
pratiquement...... 100 % 


7/- L'équation différentielle. 


Il est clair que cet ensemble de relations implique des consé- 
quences mathématiques. En éliminant les d et k, il reste une équation 
différentielle en v de la forme : 


On trouve effectivement : 


A = a/Kx 
d=d,k B-(1-aœ-w)dK*/Kx 
RSR n-2-x 


n'=x -x+l1 


Cette équationn'est pas en général élémentaire. Il est facile d'en 
faire une intégration approchée. 


Pour cela remarquons qu'on aurait n = n' pourxV = 1 ; ce qui se- 
rait le cas avec : 


XI=N0, Gr etOV=MT 25 


Il nous a paru intéressant de savoir ce qui se passerait si l'on 
faisait : 


v = 1,25 au lieu de v= 1,20 
dans le modèle de Verdoorn, sans rien changer au reste. Il vient : 


avec. n = 2 - 0.80 = 1.20 
v = (A +B) v’ 
donc 1-n<0 


d'où : VASTE VERS (AE) AR" 1)"t 
Le P.N.B. devient infini au bout d'untemps fini T, donné par l'équation: 


vi"=(A+Bjn-1)T 
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Afin de nous assurer que T est très supérieur à 20 ou 30 ans, 
faisons (1) (avec Verdoorn) : 


v, = Line 1,20,2:.K PR UT 477. 
Essayons : a = 20 % ; il vient : 

AIO 05 BORA ESEBT-A070 
d'où : T = (0.05 x 0.2)-1 =[100 ans] 
Essayons : à = 8 % ; il vient : 

À = 0,0200 ; B'= 0; 0029"; "A + B=.0,0229 


d'où : T = (0,023 x 0,2)-1-[220 anslenviron 


Concluons que le modèle ne serait plus valable à l'échelle sécu- 
laire. 


L'allure des courbes trouvées est caractérisée par leur asymptote 
verticale. 


Le produit national brut a une croissance plus rapide que la fonc- 
tion exponentielle ; son taux de croissance annuel n'est pas fixe mais 


croissant. 


Recherche des solutions à taux de croissance fixe. 
ARE RER RCE RES ER ACIER GA VERRE QE GISQUEISRANCIE LUNRE 


L'équation (V) a une solution exponentielle si (et seulement si), 
en posant v = exp (wt) : 


a) Les exposants de v, v'et v” coïncident, d'où w = wn = wn' 
Où : Wu= We (2x) = ANIME CUS 1) 
Où : Nr amet 


b) En outre les coefficients des deux membres sont égaux, 
ce qui fait (avec x = 1) : 


W=A+B 


a 
En prenant d'=1w = K + 1-4 -w, avec K = 5,(1)... il vient : 


(1) Valeurs numériques empruntées à Verdoorn lui-même. 
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[= exp ( -W-0.8a)t| 


Nous nous étonnerons que le taux d'expansion de l'économie puisse 
être (1 - W - 0,8 «), c'est-à-dire être d'autant plus faible que la pro- 
pension à épargner est grande. 

Rappelons le modèle naïf (avec 1 - w- &«= 0) 


k- av= 0 


pour lequel on aurait bien : v = v, exp wt ; k = K exp wt ; donc : 


avec :K = 5 ; v = 1 ; a = 20 % ; w = 4 %. 


[e] 


| Lorsqu'on n'a plus : 


| 


le terme À = 1 - w - à n'est pas négligeable à côté de a/K. 


Pariex: 
œ 
a = 18 % ; À= 2 D ; K = 36%; w = 5,6 % 
Le UINS 20 à K = 44%; w = 2,4% 
œ 
te DEC AA Kg = 50%: w= 0 % 


L'économie serait stagnante à = 25% (parce que l'excès d'épargne 
entrainerait une dépréciation trop forte). À l'opposé, pour «& = 0, on 
aurait w = 1 - w=20% (en l'absence de toute épargne). 


On voit à quels paradoxes on aboutit. 


8/- Observations importantes. 


Le Modèle de Verdoorn comprend (onl'a dit) 3 éléments : Capital, 
Travail, Devises. On vient de voir comment à chaque valeur de a (pro- 
pension à épargner) le premier fait correspondre une équation dif- 
férentielle définissant la loi de croissance du produit national brut ; on 
a même une idée de la forme des courbes représentant v en fonction de 
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t en économie fermée : On a vu qu'elles n'étaient pas exponentielles, 
ayant une asymptote verticale et croissant plus vite qu'une exponentielle . 
I1 est donc exclu que l'économie ait un taux de croissance uniforme 
(même à la limite au bout d'untemps assez long). Ceci parait d'ailleurs 
naturel ; carnous savons combien sont irréalistes les modèles écono- 
miques (du genre de celui de Von Neumann) où chaque secteur a le mê- 
me taux d'expansion que l'ensemble (lequel taux est également le taux 
d'intérêt. Lestaux d'expansion de chaque secteur diffèrent entre eux et 
varieront dans le temps ; leur agrégat n'a nul besoin d'une croissance 
uniforme. 


Cependant on va, avecla partie du modèle concernant le Travail, 
trouver de nouvelles conditions liant le temps, le Produit National Brut 
(v) et le Revenu National (y), ceci pour un taux d'émigration donné. 


En fin de compte, les pouvoirs publics sont censés agir sur 2 


variables instruments : (a) propension à épargner et (g) taux d'émigra- 


tion ;et s'iln'était pas procédé constamment à l'ajustement de l'un des 
instruments sur l'autre, il n'y aurait aucune raison pour que la valeur 
de (v) (calculée plus haut) soit identique (à tout instant) à la valeur de 
(v) qui va résulter des ressources en main d'oeuvre. La solution de 
l'équation différentielle donnée plus haut ne serait donc l'image des faits 
qu'autant qu'on ferait émigrer chaque année juste assez de hollandais 
pour maintenir constante la propension à épargner. (1). 


9/- Le Modèle et le Travail. 


L'offre de travail : (à population constante). 


On suppose que l'offre de travail (en heures) et le revenu moyen 
par tête (revenu national divisé par l'effectif de la population) sont liés 
par une loi à élasticité constante b: élasticité prise égale à - 0,25. 


Cette offre est par ailleurs proportionnelle à la population N, dont 
les mouvements de longue durée sont symbolisés par une variation ex- 
ponentielle du temps.: 


- taux d'accroissement naturel n(1,2 % par an) ; 
- moins :taux d'émigration y (variable-instrument). 
La demande de travail. 


On suppose que la demande (bien entendu égale à l'offre) est liée 


(1) Il est facile d'expliciter v(t) pour y constant si on le désire. 
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au P.N.B. (v) par une autre loi à élasticité constante (0,275 = DIE 


Remarques. 


1/- Letravail et le capital, nos deux facteurs de production, sont 
supposés rigoureusement complémentaires. Aucune substitution du ca- 
pital au travail n'est prévue. Ainsil'expansion économique dans un pays 
à population constante serait bloquée dès le plein emploi atteint. 


2/- Verdoorn admet (avec réticence) que dans certains cas, on 
doive introduire dans le modèle le phénomène : accroissement de la 
productivité, c'est-à-dire : progrès technique. Il conçoit celui-ci sous 
forme d'une exponentielle du temps corrigeant la loi de Demande de 
Travail. On manque d'applications numériques. 


10/- Le Modèle et la Balance extérieure : Les variables. 


Les 19 variables (15 endogènes et 4 instruments) liées par 17 
équations, laissent deux degrés de liberté. Séparée du monde extérieur, 
l'économie aurait un degré de liberté, représenté par l'instrument a 
(propension à épargner) - et par l'instrument ® (taux d'émigrationnette), 
entre qui existe une relation (du moment que l'économie est en équilibre). 


Quand on réintroduit le Monde Extérieur dans le modèle, le gou- 
vernement dispose de 2 autres instruments, qui sont désignés par Yet © : 


Y symbolise la politique d'exportations, c'est le taux de variation 
à long terme du rapport p/p" des prix à l'exportation réels et des prix 
à l'exportation ‘'compétitifs". 


o symbolise au contraire la politique d'importations, c'est le taux 
de variation à long terme de la demande d'importations. 


En pratique Verdoorn a étudié des valeurs de © nulles ou néga- 
tives (- 4 %) et au contraire des valeurs de y de part et d'autre de O0, 
pour rechercher la politique optimale (voir $ 12) et a d'ailleurs trouvé 
comme optimum pratiquement y= CO. 


A propos de cette même balance extérieure interviennent encore 
3 variables exogènes (la quatrième étant l'accroissement démographi- 
que naturel de 1.2 % par an, mentionné plus haut). 


a) Taux d'accroissement de la demande autonome importée : 
B= 0; 039: 


Pour les Pays-Bas, (vuleur faible superficie et leurs ressources 
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minérales réduites)l'expansion économique implique un développement 
permanent des importations. 


b) Indice des prix à l'importation. p'' = 1 (à toute époque) : 


I1 s'agit manifestement d'une convention commode. 


c) Taux de variation du ratio p''/p':6 = -0.0025 


Les prix compétitifs à l'exportation p"' sont rapportés aux prix 
à l'importation p'. Il est admis qu'à long terme le prix des produits 
industriels (exportés) tend à baisser par rapport au prix des matières 
premières (importées). 


11/- Le Modèleet la Balance extérieure : Les équations. 


Sur les 17 équations du modèle, nous en comptons 7 dans cette 
partie. La demande d'importations est supposée obéir à une loi à élas- 
ticités partielles constantes : par rapport aux exportations et par rap- 
portau P.N.B. Les exportations sont (de leur côté) élastiques par rap- 
port au prix relatif (p/p''); mais onleur a appliqué cette fois une formule 
d'élasticité "à la Tinbergen'"', où : 


€ 
il Sr (Er - 1) remplace Gr) (avec € = -2) 
P 


D'ailleurs les indices des prix des exportations ordinaires p et 
compétitives p' ne seront jamais dans un rapport très supérieur à 1, 
ce qui justifie l'approximation faite. 


Dans cette partie du modèle on ne compte pas moins de 5 fonctions 
exponentielles du temps. Des 5 taux : 2 sont des instruments et 2 des 
variables exogènes (déjà citées) ; le 5ème taux À est le taux de décrois- 
sance du rapport q, valeur des importations sur valeur des exporta- 
tions ; ilest choisi de manière à ramener en 20 ans ce rapport q de la 


valeur initiale 1,07 à une valeur tenue pour raisonnable (et qui n'est 
pas précisée) ; À est ce qui est appelé une variable-objectif (‘'target''). 


Lorsqu'on considère une économie réelle (non isolée du monde) 
cette partie du modèle conduit [ pour le P.N.B. v] à une expression 


explicite du temps, combinaison d'exponentielles assez simple, que 
nous avons facilement calculée numériquement. 


y = 2-2} et®/0-89 


L'instrument y symbolise la politique d'exportations àlongterme. 
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Leterme B = 0.0264 + ÿ - o+ À représente la résultante de 2 ins- 
truments Yet o, d'un objectif À, et d'élasticités structurelles dont les 
valeurs supposées ont permis de calculer 0.0264 ; y et © sont négatives 
ou positifs, À estnégatif ;tous 3 sontnécessairement petits. Ainsi nous 
n'osons trop affirmer que B sera encore positif ; à coup sur il sera 
très petit. 


a) Cas de Y négatif : 
Des 2 facteurs composant v, le premier est nécessairement crois- 


sant : à supposer B nul, v tendra vers la limite 3°*%? - 2,5 (sachant v 
égal à 1) lorsque le temps t deviendra infini. 


Si B est positif, v sera croissant et tendra (exponentiellement) 
vers l'infini. 


Si B estnégatif, v cesseraun jour de croitre et prendra le che- 
min de tendre vers zéro ; tel serait le résultat d'une politique d'austé- 
rité trop rigoureuse, due aux difficultés de la balance en devises. 


De toute façon, même si B est positif, ces fonctions v (t) crois- 
sent beaucoup moins vite que celles trouvées pour le modèle en éco- 
nomie fermée ($ 7). 


b) Cas de Y nul : 


Si B était négatif, v serait constamment et irrémédiablement dé- 
croissant. Il est plus raisonnable d'admettre B positif et v croissant 
(exponentielle à faible exposant). 


c) Cas de Y positif : 


Pour la même raison on admettra que B est positif ; le P.N.B. v 
croit d'abord mais finira par décroitre (et devrait même devenir né- 
gatif par la suite si le modèle avait encore un sens). 


Là encore le contraste avec l'allure des courbes du $7 est frap- 
pant. Ceci ne signifie pas que l'autarcie soit recommandable pour les 


Pays-Bas ; carilne serait pas réaliste de supposer à ce pays des res- 
sources naturelles illimitées de toutes les matières premières. 


On arrive plutôt à concevoir la vraie trajectoire de v(t) comme 
une suite d'arcs de courbe empruntés aux 2 systèmes de courbes : un 
arc très rapidement croissant correspondant à un déficit en devises 
alternant avec un arc stagnant correspondant à un effort du côté de la 
balance des comptes, vu qu'il est difficile d'agir simultanément et cor- 
rectement sur ces 2 sortes de leviers de commande. 
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12/- Le modèle et La notion de croissance optimale. 


Donnant à la variable-instrument o diverses valeurs, Verdoorn 
a procédé (pour une gamme de valeurs de y) au calcul en 1970 du Re- 
venu National par tête ; le graphique des résultats montre qu'il existe 
une valeur de ÿ qui maximise ce Revenu. On peut considérer que chaque 
couple © (Y) ainsi obtenu représente une politique optimale (1). 


Ce calcul numérique a été fait pour divers jeux d'hypothèses sur 
les exportations autonomes en 1970 ; c'est-à-dire qu'aulieu de se canton- 
ner àla variable exogène $ = 0.039 (voir 10,a) on a essayé une gamme 
de valeurs de f entre 0.032 et 0.046. 


CONCLUSION 


L'énorme mérite du modèle de Verdoorn, c'est de mettre en 1u- 
mière la totalité des hypothèses que comporte la projection ; il est hon- 
nête d'expliciter tout, jusqu'aux formules mathématiques inclusive- 
ment, non seulement pour autrui mais bien pour soi-même. Malheureu- 
sement le résultat n'est pas très élégant ni très clair. 


Puisse la présente note avoir aidé à faire connaitre le modèle de 
Verdoorn, les modèles économiques et les problèmes de projection à 
long terme. 


(1) Cet “optimum coïncide heureusement dans le présent modèle avec le mini- 


mum d'émigration de hollandais. C'est certainement l'aspect le plus délicat 
du modèle. 
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ANNEXE 


MODÈLE DE VERDOORN 


Equations (COV= CRidEbe mm m : importations 
inéai à 
HF (2) y=c+itbp-m b : exportations 
(5) i'=wd c : consommations 


(7) à =a y -b! 
(12) m= qb p/p' 
(13) b'= (1 - q)bp 


Equation ; ; 
HAE 1+ 
drférentielle LE" EE 1-4 
Equations à (3) k = K v* 
élasticité Us, 
constante C} D 
(8) a = w 
(Dé1)na; "a IN)" 
. : parmiles variables, 
(tm Se ï a, Le m, 
idem ne sont pas comptés 
= + -1 
linéarisée PRE {1 u(2r } 
Croissances 
exponentielles (9.2) a =a,exp(n-œt (9.1)et (9.2) 
(10) N = exp(n-p)t (11.1) et (11.2) 
(1%2)m=em; expot (15.1)et (15.2) 
(14) q = q, exp ÂÀt comptent pour 


3 équations 


(15.2) b =b,expft seulement 


(16) p =p"expyt 
(17) p'=p'expôt 
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Résultantes de 
Verdoorn 


(1) 
(Capital) (Il) 


(Travail) (III) 


(Balance 


extérieure) (IV) 
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Vend Ditl=; D) 


xk 
= v, YVPexp {r-p)(1-4)/p 


Je {ay + (1 -w) dikv- b'} 


4 << <« 
il 


vÉM={(1+e (et -1)] 1 expt[B(1-n)+Y-0+8+1] 


(avec a! = vP) 
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DES VALEURS EXTRÈMES 


Jean GEFFROY 


ERRATUM 


Page 49 THEOREME 5 - 


La démonstration de ce théorème est erronée ; nous avons substi- 
tué in extremis cette fausse démonstration, par un souci abusif de sy- 
métrie avec le théorème 4, à la démonstration originale, qui est la 
suivante : 


- En vertu du théorème 3, il nous suffit d'établir que si 
au < b,,on a : n G(b;)—>0. Si cette condition n'est pas satisfaite, il 
existe une suite infinie (n,) de valeurs de n et un nombre k > 0 tels que : 


n,G(b,,)—k quand i —>o, (C) 


Il est impossible que k = + +, car il en résulterait, d'après les 
théorèmes (3) et (4) : 
RS 


ani 


En supposant k fini, la condition(C) entraine, d'après la for- 
mule (1) : 


=k Ke EE 
2 (b,,)— e bière so 


ce qui est en contradiction avec l'hypothèse : di “be 


Nous remercions bien vivement M. Alain Cohen d'avoir attiré 
notre attention sur cette erreur. 
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